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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 目 然 科 学 的 各 
个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 非 
出 、 独 领 风 驿 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 学 科 中 
的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 划 了 研究 
的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 
迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ;而 专业 教材 的 建设 在 教育 战略 上 显 
得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美国 等 发 达 国 家 在 其 计算 机 科学 发 展 的 
几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 
将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 就 将 工 
作 重 点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，McGraw- 
Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关系 ， 
从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, Brain W. Kernighan, 
Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hoperoft, Jeffrey D. Ullman, Abraham Silberschatz, 
William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 
品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 
正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指 导 ， 还 不 秤 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 
国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 ES, “计算 机 科学 从 书 ” 已 经 出 版 了 近 两 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 其 影 
印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 图 
书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深化 ， 
教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 而 反 
馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ,我 们 的 联系 方法 如 下 : 

华章 网 站 ,www. hzbook. com 

电子 邮件 ，hzjsj@ hzbook. com 

联系 电话 ， (010)88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
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Beet. HARUKA. BARRA HT LRAT SRE AMAA 
主体 。 本 书 巧妙 地 将 数字 设计 和 计算 机 体系 结构 融合 在 一 起 ， 既 明确 了 数字 设计 是 计算 机 体系 
结构 的 基础 知识 ， 也 让 读者 了 解 了 计算 机 体系 结构 课程 如 何 运用 数字 设计 课程 中 的 关键 知识 。 
本 书 各 章节 知识 连贯 衔接 ， 自 然而 然 地 引导 读者 从 最 基本 的 0 和 1 一直 深入 到 计算 机 微 处 理 带 
的 构建 。 通 过 本 书 ， 完 全 没有 计算 机 系统 和 软 硬 件 知识 的 学 生 ， 也 能 从 零 开 始 循序 渐进 地 掌握 
设计 计算 机 微 处 理 器 以 及 编写 相应 程序 的 基本 原理 和 方法 。 

“层次 化 、 模 块 化 、 规 整 化 ”三 大 计算 机 软 硬 件 通用 的 设计 原则 ， 贯 穿 本 书 始终 。 通 过 这 
样 的 设计 思想 学 习 ， 读 者 能 建立 良好 的 工程 设计 思路 ， 为 将 来 设计 大 规模 的 复杂 软 硬 件 系 统 打 
下 良好 的 基础 。 同 时 ,第 2 版 的 内 容 紧 密 贴 近 领 域 新 动态 ， 书 中 涉及 的 相关 数据 、 编 程 语言 、 
软件 工具 、 硬 件 结构 等 都 紧 跟 行 业 发 展 。 在 征 得 原 书 作者 和 原 出 版 社 同意 的 情况 下 ， 本 书 增加 
了 附录 D “MIPS 处 理 器 的 FPGA 实现 ”， 补 充 在 实际 开发 板 和 软件 开发 环境 上 设计 和 实现 计算 
机 微 处 理 器 系统 的 相关 内 容 。 通 过 本 书 的 学 习 ， 能 增强 读者 使 用 主流 工具 和 开发 环境 进行 实际 
应 用 设计 的 能 力 。 

此 外 ， 本 书 内 容 丰 富 充实 ,文字 通俗 流畅 ， 叙 述 风趣 幽默 ， 并 配 有 大 量 示例 和 习题 ， 有 助 
于 读者 理解 和 掌握 数字 设计 和 计算 机 体系 结构 的 相关 知识 。 本 书 不 仅 适 合用 于 相关 专业 课程 的 
教学 ， 也 适合 作为 相关 工程 技术 人 员 的 参考 书籍 。 

本 书 由 华南 理工 大 学 陈 俊 颖 翻译 定稿 。 在 本 书 的 完成 过 程 中 ， 华 南 理工 大 学 的 陈 虎 ( 原 书 
第 1 版 译 者 ) 和 闵 华 清 等 老师 给 予 了 大 力 的 支持 与 帮助 ， 机 械 工业 出 版 社 的 姚 荔 等 编辑 提出 了 
宝贵 的 意见 并 付出 了 辛勤 的 劳动 ，Imagination Technologies 公司 的 RobertOwen, Laurence Keung 
和 工程 师 提供 了 积极 的 建议 和 技术 支持 ， 在 此 对 他 们 表示 衷心 的 感谢 ! 

在 本 书 翻译 过 程 中 ， 译 者 力求 准确 无 误 地 表达 原文 意思 ， 尽 可 能 使 文字 流畅 易 懂 。 但 是 受 
译 者 水 平和 时 间 所 限 ， 难 免 有 朴 漏 和 错误 之 处 ， 奶 请 广大 读者 不 音 指 正 。 

最 后 ， 特 别 感谢 我 的 家 人 一 直 以 来 对 我 无 私 的 关爱 。 


译 者 
2016 年 1 月 6 日 
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本 书 以 一 种 易于 接受 的 方式 介绍 了 从 计算 机 组 成 和 设计 到 更 细节 层次 的 教学 内 容 ， 展 现 了 
如 何 使 用 VHDL 和 System Verilog 语言 设计 MIPS 处 理 器 的 技术 细节 。 为 学 生 提 供 在 现代 FPGA 
上 实现 大 型 数字 系统 设计 的 机 会 。 书 中 提供 的 方法 既 向 学 生 传 授 了 知识 又 具有 启发 性 。 
David A. Patterson， 加 利 福 尼 亚 大 学 伯克利 分 校 





本 书 为 传统 的 教学 内 容 提供 了 新 的 视角 。 很 多 教科 书 看 上 去 像 繁 杂 的 灌木 从 ， 作 者 在 这 

本 书 中 将 “ 枯 枝 ”去 除 ， 同 时 保留 了 最 基本 的 内 容 ， 并 把 这 些 内 容 放 到 了 现代 的 环境 中 。 因 
此 ， 他 们 提供 的 教材 可 以 激发 学 生 未 来 挑战 设计 方案 的 兴趣 。 

一 一 Jim Frenzel， 爱 达 荷 大 学 


Harris 的 写作 风格 引人入胜 ， 而 且 能 提供 很 多 知识 。 他 们 对 材料 的 运用 水 平 很 高 ， 通 过 大 
量 的 图 来 引导 学 生 进 入 计算 机 工程 领域 。 组 合 逻 辑 电 路 、 微 体系 结构 和 存储 器 系统 等 内 容 处 理 
得 非常 好 。 





James Pinter-Lucke， 克 莱 蒙 麦 肯 纳 学 院 


Harris 的 这 本 书 非常 清晰 且 易于 理解 。 习 题 的 设计 非常 好 ， 同 时 也 提供 了 很 多 现实 案例 。 
这 本 书 避免 了 许多 其 他 教材 中 宛 长 而 费解 的 解释 。 很 明显 ， 作 者 花费 了 很 多 时 间 和 努力 来 提高 
这 本 书 的 可 读 性 。 本 人 强烈 推荐 这 本 书 。 





Peiyi Zhao ， 查 普 曼 大 学 


Harris 撰写 了 一 部 成 功 融 合 数字 系统 设计 和 计算 机 体系 结构 的 教材 。 这 是 一 本 很 受 欢 迎 的 
ARE, 它 介绍 了 很 多 数字 系统 设计 的 内 容 ， 同 时 详细 解释 了 MIPS 体系 结构 的 细节 。 本 人 强 
烈 推 荐 这 本 书 。 





James E. Stine, Jr. ， 俄 克拉 荷 马 州立 大 学 


这 是 一 本 令 人 印象 深刻 的 书 。Harris 将 晶体 管 、 电 路 、 逻 辑 门 、 有 限 状 态 机 、 存 储 器 、 算 
术 部 件 等 微 处 理 器 设计 中 的 所 有 重要 元 素 完美 地 结合 在 一 起 ， 并 最 终 引 出 计算 机 体系 结构 。 这 
本 书 为 理解 如 何 完美 地 设计 复杂 系统 提供 了 很 好 的 指导 。 





Jaeha Kim ，Rambus 公司 


这 是 一 本 写 得 非常 好 的 书 ， 不 仅 适 用 于 第 一 次 学 习 这 些 领 域 的 年 轻 工 程 师 ， 而 且 可 以 为 有 
经 验 的 工程 师 提 供 参考 。 本 人 强烈 推荐 这 本 书 。 
— A. Utku Diril, Nvidia 公司 
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目前 已 经 有 很 多 优秀 的 数字 逮 辑 设计 书籍 ， 也 有 一 些 很 好 的 计算 机 体系 结构 教材 (例如 ， 
Patterson 和 Hennessy 撰写 的 经 典 教 材 ) ， 为 什么 还 需要 出 版 一 本 包含 了 数字 逻辑 设计 和 体系 结 
构 的 书 呢 ? 本 书 的 独特 之 处 在 于 从 计算 机 体系 结构 的 视角 来 学 习 数 字 逻 辑 设计 ， 内 容 从 基本 的 
二 进 制 开始 ， 直 到 引导 学 生 完 成 MIPS 处 理 器 的 设计 。 

多 年 来 ,我 们 曾 在 哈 维 玛 德 学 院 使 用 了 多 个 版 本 的 《Computer Organization and Design》( 计 
算 机 组 成 与 设计 ) (由 Patterson 和 Hennessy 摆 写 ) 。 我 们 特别 欣赏 该 书 覆 盖 了 MIPS Lb dH ae AY) 
系 结构 和 微 体系 结构 ， 因 为 MIPS 处 理 器 是 获得 商业 成 功 的 体系 结构 ， 而 且 它 也 非常 简单 ， 可 
以 在 导论 课程 中 向 学 生 解 释 清楚 ， 并 可 以 由 学 生 自 主 设计 和 实现 。 由 于 我 们 的 课程 没有 预 修 课 
程 ， 所 以 前 半 个 学 期 需要 介绍 数字 逻辑 设计 ， 而 这 部 分 没有 被 《Computer Organization and De- 
sign》 所 包含 。 其 他 大 学 也 表示 需要 一 本 能 包含 数字 电路 设计 和 体系 结构 的 教材 。 于 是 ， 我 们 
着 手 开 始 准备 这 样 一 本 包含 了 数字 逻辑 设计 和 体系 结构 的 书 。 

我 们 相信 设计 处 理 器 对 于 电子 工程 和 计算 机 专业 的 学 生 是 一 个 特殊 而 重要 的 经 历 。 对 外 行 
而 言 ， 处 理 器 内 部 的 工作 几乎 像 魔术 一 样 ， 然 而 事实 证 明 ， 如 果 详 细 解 释 ， 处 理 器 的 工作 原理 
就 非常 易于 理解 。 数 字 逻 辑 设 计 本 身 是 一 个 邻 人 激动 的 主题 。 汇 编 语言 程序 则 揭示 了 处 理 天 内 
部 所 用 的 语言 。 而 微 体系 结构 将 两 者 联系 在 一 起 。 

本 书 适 合 于 在 一 个 学 期 内 完成 教学 的 数字 逻辑 设计 和 计算 体系 结构 人 门 课程 ， 也 可 以 用 于 
两 个 学 期 的 教学 ， 以 便 用 更 多 的 时 间 来 消化 和 理解 书 中 所 讲 的 知识 并 在 实验 室 中 进行 实践 。 不 
需要 任何 预 修 内 容 也 可 以 教授 这 个 课程 。 本 书 一 般 在 大 学 本 科 二 年 级 或 者 三 年 级 使 用 ， 也 可 以 
提供 给 聪明 的 一 年 级 学 生 学 习 。 


TF FA 
本 书 有 以 下 特点 。 


并 列 讲 述 SystemVerilog 和 VHDL 语言 


硬件 描述 语言 ( Hardware Description Language, HDL) 是 现代 数字 逻辑 设计 实践 的 中 心 ， 而 
设计 者 分 成 了 SystemVerilog 语言 和 VHDL 语言 两 个 阵营 。 在 介绍 了 组 合 逻 辑 和 时 序 逻 辑 设 计 
后 ， 本 书 紧 接着 就 在 第 4 章 介 绍 硬件 描述 语言 。 硬 件 描述 语言 将 在 第 5 章 和 第 7 章 用 于 设计 更 
大 的 模块 和 整个 处 理 器 。 然 而 ， 如 果 不 讲授 硬件 描述 语言 ， 那 么 可 以 跳 过 第 4 章 ， 而 后 续 章 市 
仍然 可 以 继续 使 用 。 

本 书 的 特色 在 于 使 用 并 列 方式 讲述 SystemVerilog 和 VHDL， 使 读者 可 以 快速 地 对 比 两 种 语 
言 。 第 4 章 描 述 适 用 于 这 两 种 硬件 描述 语言 的 原则 ,而且 并 列 给 出 了 这 两 种 语言 的 语法 和 实 
例 。 这 种 并 列 方法 使 得 在 教学 中 教师 可 以 选择 其 中 一 种 硬件 描述 语言 来 讲述 ， 也 可 以 让 读者 在 
专业 实践 中 很 快 地 从 一 种 描述 语言 转 到 男 一 种 描述 语言 。 


经 典 的 MIPS 体系 结构 和 微 体系 结构 


第 6 章 和 第 7 章 主 要 介绍 MIPS 体系 结构 。 这 部 分 内 容 主要 改编 自 Patterson 和 Hennessy 的 
论著 。MIPS 是 一 个 理想 的 体系 结构 ， 因 为 每 年 有 上 百 万 实际 产品 投入 使 用 ， 而 且 高 效 和 易于 
学 习 。 同 时 ,世界 各 地 上 百 所 大 学 已 经 围绕 MIPS 体系 结构 开发 了 教学 内 容 、 实 验 和 工具 。 


现实 视角 


第 6、7、8 章 列举 了 Intel 公司 x86 处 理 器 系列 的 体系 结构 、 微 体系 结构 和 存储 器 层次 结 
构 。 第 8 章 还 介绍 了 Microchip PIC32 微 控 制 器 的 外 部 设备 。 这 些 章节 揭示 了 书 中 所 讲 的 概念 如 
何 应 用 到 很 多 PC 内 部 芯片 和 消费 电子 产品 的 设计 中 。 


高 级 微 体系 结构 概览 


第 7 章 介绍 了 现代 高 性 能 微 体系 结构 的 特征 ， 包 括 分 支 预测 、 超 标量 、 乱 序 执行 操作 、 多 
线程 和 多 核 处 理 器 。 这 些 内 容 对 于 第 一 次 上 体系 结构 课程 的 学 生 比 较 容易 理解 ， 并 说 明了 本 书 
介绍 的 微 体 系 结构 原理 是 如 何 扩展 到 现代 处 理 器 的 设计 中 的 。 


章 未 的 习题 和 面试 问题 


学 习 数 字 设 计 的 最 佳 方式 是 实践 。 每 章 的 最 后 有 很 多 习题 来 实际 应 用 所 讲述 的 内 容 。 习 题 
后 面 是 同行 向 申请 这 个 领域 工作 的 学 生 提出 的 一 些 面 试问 题 。 这 些 问题 可 以 让 学 生 感 受到 面试 
过 程 中 可 能 遇见 的 典型 问题 。 习 题 答案 可 以 通过 本 书 的 配套 网 站 和 教师 网 站 获得 。 更 详细 的 内 
容 参 见 下 文 一 一 在 线 补充 资料 。 


在 线 补充 资料 


补充 材料 可 以 通过 textbooks. elsevier. com/9780123944245 获得 。 本 书 配套 网 站 (对 所 有 读者 
开放 ) 包 括 了 以 下 内 容 : 

e 奇数 编号 习题 的 答案 。 

e Altera® 和 Synopsys® 公司 专业 版 计算 机 辅助 设计 工具 的 链接 。 

© QtSpim( 一 般 称 为 SPIM) 的 链接 ， 一 个 MIPS REMAR o 

e MIPS 处 理 器 的 硬件 描述 语言 (HDL) 代 码 。 

e Altera Quartus 了 [工具 的 提示 。 

è Microchip MPLAB IDE( 集 成 开发 环境 ) 工具 的 提示 。 

e PPT 格式 的 电子 教案 。 

o 课程 示例 和 实验 素材 。 

e 勘误 表 。 

教师 网 站 ( 链接 到 本 书 配套 网 站 ， 仅 提供 给 在 textbooks. elsevier. com 注册 的 使 用 者 ) 包 括 : 

e 所 有 习题 的 答案 。 

© Altera® 和 Synopsys® 公司 专业 版 计算 机 辅助 设计 工具 的 链接 (Synopsys 公司 为 取得 资格 
认证 的 大 学 提供 Synplify® Premier 工具 的 50 个 许可 证 。 更 多 Synopsys 大 学 计划 内 容 请 参 
见 本 书 教师 网 站 )。 

o JPG 格式 和 PPT 格式 的 书 中 插图 。 


关于 在 课程 中 使 用 Altera、Synopsys 、Microchip 和 QtSpim 工具 的 更 详细 的 内 容 请 参见 下 文 。 
构建 实验 工具 的 细节 也 将 在 下 面 介绍 。 


暂 “ 关 于 本 书 教 辅 资 源 ， 使 用 教材 的 教师 需 通过 爱 思 唯 尔 的 教材 网 站 ( www. textbooks, elsevier. com) 注册 并 通过 审批 
后 才能 获取 。 具 体 方法 如 下 : 在 www. textbooks. elsevier. com 教材 网 站 查找 到 该 书后 ， 点 击 “instructor manual” 
便 可 申请 查看 该 教师 手册 。 有 任何 问题 ， 请 致电 010-85208853。 一 一 编辑 注 
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如 何 使 用 课程 中 的 软件 工具 
Altera Quartus |l 


Quartus II Web Edition 是 Quartus’ [| FPGA 设计 工具 的 免费 版 本 。 基 于 此 软件 ， 学 生 可 以 
使 用 原理 图 或 者 硬件 描述 语言 (SystemVerilog 或 VHDL) 完成 数字 逻辑 设计 。 在 完成 设计 后 ， 学 
生 可 以 使 用 Altera Quartus I Web Edition 中 包含 的 ModelSim™ -Altera Starter Edition 工具 模拟 电 
路 。Quartus I Web Edition 还 包含 支持 SystemVerilog 或 者 VHDL 的 内 置 逻 辑 综合 工具 。 

Web Edition 和 Subscription Edition 两 个 软件 的 区 别 在 于 ，Web Edition 仅 支持 Altera 公司 部 
分 常用 的 FPGA 器 件 。ModelSim-Altera Starter Edition 和 ModelSim 商业 版 的 区 HÆF, Starter 
.Edition 降 低 了 10 000 多 行 硬件 描述 语言 代码 的 模拟 速度 。 


Microchip MPLAB IDE 


Microchip MPLAB IDE 是 用 于 PIC 微 控制 器 编程 的 工具 ， 可 免费 下 载 。MPLAB 将 程序 的 编 
写 、 编 译 、 模 拟 和 调试 集成 到 一 个 界面 。 它 包括 一 个 C 编译 器 和 调试 器 ， 人 允许 学 生 开 发 5 语言 
和 汇编 程序 ， 编 译 它们 ， 以 及 可 选择 地 将 它们 编程 到 PIC 微 控制 项 。 


ALA.: Synplify Premier 和 QtSpim 


Synplify Premier 和 QtSpim 是 本 课程 资料 的 可 选 工具 。 

Synplify Premier 产品 是 一 个 面向 FPGA 和 CPLD 设计 的 综合 和 调试 环境 。 它 包 含 HDL Ana- 
lyst， 一 个 独特 的 图 形 化 HDL 分 析 工 具 ， 自 动 生成 可 以 回 HDL 源 代码 交叉 探测 的 设计 示意 图 。 
在 学 习 和 调试 过 程 中 这 非常 有 用 。 

Synopsys 公司 为 取得 资格 认证 的 大 学 提供 Synplify® Premier 工具 的 50 个 许可 证 。 更 多 关于 
Synopsys 大 学 计划 内 容 或 者 Synopsys FPGA 设计 软件 信息 ,请 参见 本 书 教师 网 站 
( textbooks. elsevier. com/9780123944245 ) 。 

QtSpim ( 简称 为 SPIM) 是 一 个 可 运行 MIPS 汇编 代码 的 MIPS 模拟 器 。 学 生 可 以 在 文本 文 
件 中 输入 MIPS 汇编 代码 ， 通 过 QtSpim 进行 模拟 。QtSpim 显示 指令 、 存 储 器 和 寄存 器 的 值 。 
用 户 手 册 和 示例 文件 的 链接 可 以 通过 本 书 配 套 网 站 (textbooks. elsevier. com/9780123944245 ) 
访问 。 


实验 

配套 网 站 提供 了 从 数字 逻辑 设计 到 计算 机 体系 结构 的 一 系列 实验 的 链接 。 这 些 实验 教学 生 
如 何 使 用 Quartus [工具 来 输入 、 模 拟 、 综 合 和 实现 他 们 的 设计 。 这 些 实验 也 包含 了 使 用 Mi- 
crochip MPLAB IDE 完成 C 语言 和 汇编 语言 编程 的 内 容 。 

经 过 综合 后 ， 学 生 可 以 在 Altera DE2 开发 和 教育 板 上 实现 自己 的 设计 。 这 个 功能 强大 且 具 
有 价格 优势 的 开发 板 可 以 通过 www. altera. com 获得 。 该 开发 板 包 含 可 通过 编程 来 实现 学 生 设 计 
的 FPGA。 我 们 提供 的 实验 描述 了 如 何 使 用 Cyclone I Web Edition Æ DE2 开发 板 上 实现 一 些 
设计 。 

为 了 运行 这 些 实验 ， 学 生 需 要 下 载 并 安装 Altera Quartus I Web Edition 和 Microchip MPLAB 
IDE。 教 师 也 需要 选择 软件 安装 在 实验 室 的 机 器 上 。 这 些 实验 包括 如 何在 DE2 开发 板 上 实现 项 
目的 指导 。 这 些 实现 步骤 可 以 跳 过 ， 但 是 我 们 认为 它 有 很 大 的 价值 。 

我 们 在 Windows 平台 上 测试 了 所 有 的 实验 ， 当 然 这 些 工具 也 可 以 在 Linux 上 使 用 。 


TEIR 


正如 所 有 有 经 验 的 程序 员 所 知道 的 ， 比 较 复 杂 的 程序 都 毫 无 疑问 存在 潜在 的 错误 。 本 书 也 
不 例外 。 我们 花费 了 大 量 的 精力 查找 和 去 除 本 书 的 错误 。 然 而 ,错误 仍然 不 可 避免 。 我 们 将 在 
本 书 的 网 站 上 维护 和 更 新 勘误 表 。 

请 将 你 发 现 的 错误 发 送 到 ddcabugs@ onehotlogic. com。 第 一 个 报告 实质 性 错误 而 且 在 后 续 
版 本 中 采用 了 其 修改 意见 的 读者 可 以 得 到 1 美元 的 奖励 ! 
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1.1 课程 计划 

在 过 去 的 三 十 年 里 ， 微 处 理 器 彻底 变革 了 我 们 的 世界 。 现 在 一 台 
笔记 本 电脑 的 计算 能 力 都 远 远 超 过 了 过 去 一 个 房间 大 小 的 大 型 计算 机 。 
高 级 汽车 上 包含 了 大 约 50 个 微 处 理 器 。 微 处 理 器 的 进步 使 得 移动 电话 
和 因特网 (Internet) 成 为 可 能 ， 极 大 地 促进 了 医学 的 进步 ， 也 改变 了 战 
争 的 式样 。 全 球 集成 电路 工业 销售 额 从 1985 年 的 210 亿美 元 发 展 到 
2012 年 的 3000 亿美 元 ， 其 中 微 处 理 器 占 到 了 重要 部 分 。 我 们 相信 微 处 
理 器 不 仅仅 只 是 对 技术 、 经 济 和 社会 有 重要 意义 ,而且 它 也 潜在 地 激 
发 了 人 类 的 创造 力 。 在 读者 学 习 完 本 书后 ， 将 学 会 如 何 设计 和 构造 一 
个 属于 自己 的 微 处 理 器 。 这 些 基 本 技能 将 为 读者 设计 其 他 数字 系统 黄 TR 
定 坚实 的 基础 。 

我 们 假设 读者 对 电子 学 有 基本 的 认识 ， 有 一 定 的 编程 经 验 和 基础 ， M 
同时 对 理解 微 处 理 器 的 内 部 运行 原理 有 真正 的 兴趣 。 本 书 将 集中 讨论 “国生 en 
基于 0 和 1 的 数字 系统 的 设计 。 我 们 从 接收 0 和 1 作为 输入 ， 产 生 0 和 
1 作为 输出 的 逻辑 门 开 始 本 课程 。 接 着 ， 我 们 将 研究 如 何 利 用 这 些 逻 辑 
门 构成 加 法 器 、 存 储 器 等 比较 复杂 的 模块 。 随 后 ， 我 们 将 学 习 使 用 微 
处 理 器 的 语言 (汇编 语言 ) 进行 程序 设计 。 最 后 ， 我 们 将 上 述 内 容 结合 
起 来 构造 一 个 能 执行 汇编 程序 的 微 处 理 器 。 

数字 系统 的 一 个 重要 特点 是 其 构造 模块 相当 简单 :仅仅 包括 0 和 
1。 它 不 需要 繁杂 的 数学 知识 或 高 深 的 物理 学 知识 。 相 反 ， 设 计 者 的 最 
大 挑战 是 如 何 将 这 些 简单 的 部 件 组 合 起 来 构成 复杂 的 系统 。 微 处 理 器 可 能 是 读者 构造 的 第 一 个 
复杂 系统 ， 其 复杂 性 可 能 一 下 子 难以 全 部 接受 。 因 此 ， 如 何 控制 复杂 性 是 贯穿 全 书 的 一 个 重要 
主题 。 


1.2 控制 复杂 性 的 艺术 


与 非 专业 人 员 相 比 ， 计 算 机 科学 家 或 工程 师 的 一 个 重要 特征 是 掌握 了 系统 地 控制 复杂 性 的 
方法 。 现 代数 字 系 统 由 上 百 万 ， 甚 至 数 十 亿 的 晶体 管 构成 。 没 有 人 能 通过 为 每 个 晶体 管 的 电子 
运动 建立 并 求解 方程 的 方法 来 理解 这 样 的 系统 。 读 者 必须 学 会 如 何 控制 复杂 性 ， 从 而 理解 如 何 
在 不 陷 和 人 细节 的 情况 下 构造 微 处 理 器 系统 。 


1.2.1 抽象 


管理 复杂 性 的 关键 技术 在 于 抽象 (abstraction) : 隐蔽 不 重要 的 细节 。 一 个 系统 可 以 从 多 个 
不 同 层 面 抽象 。 例 如 ， 美 国 的 政治 家 将 世界 抽象 为 城市 、 县 、 州 和 国家 。 一 个 县 包含 了 多 个 城 
市 ， 而 一 个 州 则 包含 了 多 个 县 。 当 一 个 政治 家 竞选 总 统 时 ， 他 更 对 整个 州 的 投票 情况 有 兴趣 ， 
而 不 是 单个 县 。 因 此 ， 州 在 这 个 层次 中 的 抽象 更 有 益处 。 另 一 方面 ， 美 国人 口 调查 局 需要 统计 
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每 个 城市 的 人 口 ， 必 须 考虑 更 低层 次 抽象 的 细节 。 

图 1-1 给 出 了 一 个 电子 计算 机 系统 的 抽象 层次 ， 其 中 在 
每 个 层次 中 都 包含 了 典型 的 模块 。 最 底层 的 抽象 是 物理 层 ， 
即 电子 的 运动 。 电 子 的 行为 由 量子 力学 和 麦克 期 韦 (Max- 
well) 方 程 描述 。 系 统 由 晶体 管 或 以 前 的 真空 管 等 电子 器 件 
(device) 构 成 。 这 些 历 件 都 有 明确 定义 的 称 为 称 端子 (termi- 
nal) 的 外 部 连接 点 ， 并 建立 了 每 个 端子 上 的 电压 和 电流 之 间 
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的 关系 模型 。 通 过 器 件 级 的 抽象 ， 我 们 可 以 忽略 单个 电子 。 ewe 
更 高 一 级 的 抽象 为 模拟 电路 (analogy circuit ) 。 在 这 一 级 中 ， 加 法 器 
器 件 组 合 在 一 起 构造 成 放大 器 等 组 件 。 模 拟 电路 的 输入 和 输 存储 器 
出 都 是 连续 的 电压 值 。 逻 辑 门 等 数字 电路 (digital circuit ) 则 与 站 
将 电压 控制 在 离散 的 范围 内 ， 以 便 表示 0 和 1。 在 逻辑 设计 或 i] 
中 ,我 们 将 使 用 数字 电路 构造 更 复杂 的 结构 ， 例 如 加 法 器 或 
FF REAR o 晶体 管 
微 结 构 将 逻辑 和 体系 结构 层次 的 抽象 连接 在 一 起 。 体 系 二 极 管 
结构 (architecture) 层 描述 了 程序 员 观 点 的 计算 机 抽象 。 例 i 





如 ， 目 前 广泛 应 用 于 个 人 计算 机 (了 Personal Computer, PC) 的 
Intel x86 ERREN T — Et S KBE A AF FF ai 用 于 存储 图 1-1 电子 计算 机 系统 的 抽象 层次 
临时 变量 的 存储 器 ) ， 程 序 员 可 以 使 用 这 些 指令 和 寄存 器 。 
微 结 构 将 逻辑 元 素 组 合 在 一 起 来 实现 体系 结构 中 定义 的 指令 。 一 个 特定 的 体系 结构 可 以 有 不 同 
的 微 结 构 实 现 方式 ， 以 便 取 得 在 价格 、 性 能 和 功 耗 等 方面 的 不 同 折 中 。 例 如 ，Intel Core i7, In- 
tel 80486 和 AMD Athlon 等 都 是 x86 体系 结构 的 三 种 不 同 的 微 结 构 实 现 。 

进入 软件 层面 后 ， 操 作 系 统 负 责 处 理 底层 的 抽象 ， 例 如 访问 硬盘 或 管理 存储 右 。 最 后 ， 
应 用 软件 使 用 操作 系统 提供 的 这 些 功能 来 解决 用 户 的 问题 。 正 是 借助 于 抽象 的 威力 ， 年 迈 
的 祖母 可 以 通过 计算 机 上 网 ， 而 不 用 考虑 电子 的 量子 波动 (vibration) 或 计算 机 中 的 存储 怖 组 
织 问题 。 

本 书 主要 讨论 从 数字 电路 到 体系 结构 之 间 的 抽象 层次 。 当 读者 处 于 某 个 抽象 层次 时 ， 最 好 
能 了 解 当 前 抽象 层次 的 之 上 和 之 下 的 层次 。 例 如 ， 计 算 机 科学 家 不 可 能 在 不 理解 程序 运行 平台 
的 体系 结构 的 情况 下 来 充分 优化 代码 。 在 不 了 解 晶体 管 具 体 用 途 的 情况 下 ， 需 件 工程 师 也 不 能 
在 晶体 管 设 计时 做 出 明智 的 设计 选择 。 我 们 和 希望 读者 学 习 完 本 书后 ， 能 选择 堪 确 的 层次 解决 问 
题 ， 同 时 评估 自己 的 设计 选择 对 其 他 抽象 层次 的 影响 。 


1. 2.2 约束 


约束 (discipline) 是 对 设计 选择 的 一 种 内 在 限制 ， 通 过 这 种 限制 可 以 更 有 效 地 在 更 高 的 抽象 
层次 上 工作 。 使 用 可 互 换 部 件 是 约束 的 一 种 常见 应 用 ， 其 典型 例子 是 来 复 枪 (tlintlock rifle) 的 
制作 。 在 19 世纪 早期 ,来 复 枪 靠 手工 一 支 支 地 制作 。 来 复 枪 的 零件 从 很 多 不 同 的 手工 制作 商 
那里 买 来 ， 然 后 由 一 个 技术 熟练 的 做 枪 工人 组 装 在 一 起 。 基 于 可 互 换 部 件 的 约束 变 昔 了 这 个 产 
业 。 通 过 将 零件 限定 为 一 个 误差 允许 范围 内 的 标准 集合 ， 就 可 以 很 快 地 组 装 和 修复 来 复 枪 ， 而 
且 不 需要 太 熟 练 的 技术 。 做 枪 工人 不 再 需要 考虑 枪 管 和 枪 托 形状 等 较 低层 次 的 抽象 。 

在 本 书 中 ， 对 数字 电路 的 约束 非常 重要 。 数 字 电 路 使 用 离散 电压 ， 而 模拟 电路 使 用 连续 电 
压 。 因 此 ， 数 字 电 路 是 模拟 电路 的 子 集 ， 而 且 在 某 种 意义 上 其 能 力 弱 于 范围 更 广 的 模拟 电路 。 
然而 ， 数 字 电 路 的 设计 很 简单 。 通 过 数字 电路 的 约束 规则 ， 我 们 可 以 很 容易 地 将 组 件 组 合成 复 


二 进 hl 了 


杂 的 系统 ， 而 且 这 种 数字 系统 在 很 多 应 用 上 都 远 远 优 于 由 模拟 组 件 组 成 的 系统 。 例 如 ， 数 字 化 
的 电视 、 光 盘 (CD) 以 及 移动 电话 正在 取代 以 前 的 模拟 设备 。 


1.2.3 = Y 原则 


除了 抽象 和 约束 外 ， 设 计 者 还 使 用 另外 三 条 准则 来 处 理 系 统 的 复杂 性 : 层次 化 (hierar- 
chy) 、 模 块 化 (modularity) 和 规整 化 (regularity) 。 这 些 原则 对 于 软 硬 件 的 设计 都 是 通用 的 。 
© 层次 化 : 将 系统 划分 为 若干 模块 ， 然 后 更 进一步 划分 每 个 模块 直到 这 些 模块 可 以 很 容 
易 理 解 。 

© 模块 化 : 所 有 模块 有 定义 好 的 功能 和 接口 ， 以 便于 它们 之 间 可 以 很 容易 地 相互 连接 而 
不 会 产生 意 想不到 的 副作用 。 

© 规整 化 : 在 模块 之 间 寻 求 一 致 ， 通 用 模块 可 以 重复 使 用 多 次 ， 以 便 减 少 设计 不 同 模块 
的 数量 。 

我 们 用 制作 来 复 枪 的 例子 来 解释 这 三 Y 
原则 。 在 19 世纪 早期 ， 来 复 枪 是 最 复杂 的 
常见 物品 之 一 。 使 用 层次 化 原理 ， 可 以 将 它 
划分 为 图 1-2 所 示 的 几 个 组 件 : 枪 机 (lock)、 
枪 托 和 枪 管 。 

枪 管 是 一 个 长 的 金属 管子 ,子弹 就 是 
通过 这 里 射出 的 ; 枪 机 是 一 种 射击 设备 ; 
而 枪 托 是 用 木头 制 成 的 ， 它 将 各 个 部 分 连 
接 起 来 并 为 使 用 者 提供 牢固 的 握 枪 位 置 。 
相应 地 ， 枪 机 包含 扳机 、 击 锤 、 燃 石 、 扣 
簧 和 药 锅 。 每 个 组 件 都 可 以 用 进一步 层次 
化 来 描述 。 

模块 化 使 得 每 个 组 件 都 应 有 明确 定义 
的 功能 和 接口 。 枪 托 的 功能 是 装配 枪 机 和 oes 
枪 管 ， 它 的 接口 包括 长 度 和 装配 钉 的 位 置 。 枪 机 局 部 图 © 
在 模块 化 的 来 复 枪 设计 中 ， 如 果 长 度 和 装 图 1-2 来 复 枪 及 其 枪 机 的 特写 照片 
配 钉 的 位 置 都 合适 ， 那么 来 = 于 不 同 制 造 (照片 由 Euroarms Italia 提供 。www. euroarms. net@ 2006 ) 
商 的 枪 托 可 以 用 于 特定 的 枪 管 。 枪 管 的 功 
能 是 使 子弹 更 加 精确 地 射出 ， 模 块 化 设计 规定 它 不 能 产生 副作用 : 对 枪 管 的 设计 不 能 影响 
枪 托 的 功能 。 

规整 化 表明 可 互 换 部 件 是 一 个 好 方法 。 利 用 规整 化 原理 ， 一 个 损坏 的 枪 管 可 以 用 相同 的 部 
分 取代 。 可 以 在 装配 线 上 更 有 效 地 生产 枪 管 ， 而 不 是 辛苦 地 手工 制作 。 

层次 化 、 模 块 化 和 规整 化 这 三 条 原则 在 本 书 中 很 重要 ， 它 们 将 贯穿 本 书 的 内 容 。 


1.3 数字 抽象 


大 部 分 物理 变量 是 连续 的 。 例 如 ， 电 线 上 的 电压 、 震 动 的 频率 、 物 体 的 位 置 等 都 是 连续 
值 。 相 反 ， 数 字 系 统 使 用 离散 值 变 量 ( discrete- valued variable ) 来 表示 信息 一 一 也 就 是 说 ， 变 量 
是 有 限 数 目的 不 同 离散 值 。 

早期 Charles Babbage 的 分 析 机 ( Analytical Engine ) 使 用 具有 10 个 离散 值 变量 的 数字 系统 。 
从 1834 年 到 1871 Æ, Babbage 一 直 在 设计 和 尝试 制作 这 种 机 械 计算 机 。 分 析 机 使 用 从 0 号 ~9 





` 


号 10 个 齿轮 表示 0 ~9 这 10 个 数字 ， 这 很 像 汽 车 的 机 械 里 程 表 。 图 1-3 展示 了 这 种 分 析 机 的 原 
型 ， 其 中 每 一 行 表示 一 个 数字 ，Babbage 使 用 了 25 行 齿 
轮 ， 因 此 这 人 台 机 器 的 精度 为 25 位 数字 。 

与 Babbage 的 机 器 不 同 的 是 ， 大 部 分 电子 计算 机 使 用 
二 进 制 (2 个 值 ) 表 示 ， 其 中 高 电压 表示 '1' ， 低 电压 表示 
'0'。 这 是 因为 区 分 2 种 电压 比 区 分 10 种 容易 得 多 。 

一 个 有 入 个 不 同 状 态 的 离散 值 变量 的 信息 量 
(amount of information) D 由 位 (bit, 或 称 为 比特 ) 度 量 ,，N 
Ail D ZAIN KAZ: 
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D = log, N 位 (1-1) 

一 个 二 进 制 状态 变量 包含 log,2 =1 位 的 信息 ， 事 实 上 ， 
位 是 二 进 制 数字 (binary digit) 的 缩写 。 每 一 个 Babbage 的 齿 
轮 包含 log,10 =3. 322 位 的 信息 ， 因 为 它 能 够 表示 2 ”= 
10 不 不 同 状态 之 一 。 一 个 连续 信号 理论 上 包含 了 无 穷 多 TY Mele 的 
的 信息 ;因为 它 可 以 表示 无 穷 多 个 数值 。 实 际 上 ， 对 于 Copan aan nee weRAe 
很 多 连续 的 信号 来 说 ， 品 声 和 测量 误差 将 信息 量 限 制 在 
10 ~ 16 位 之 间 。 如 果 需 要 对 信号 进行 快速 测量 ， 其 信息 量 更 低 ( 例 如 ，8 位 )。 

”本 书 着 重 讲述 使 用 二 进 制 变量 1 和 0 表示 的 数字 电路 。George Boole 发 明了 一 种 针对 二 进 
制 变量 进行 逻辑 操作 的 系统 ， 称 为 布尔 逻辑 ( Boolean logic)。 每 个 布尔 变量 都 是 TRUE 或 
FALSE。 电 子 计算 机 普遍 使 用 正 电压 表示 '1' ， 使 用 0 电压 表示 '0'。 本 书 中 使 用 的 '1' TRUE 
和 HIGH 表示 同等 的 含义 。 同 样 ， 本 书 中 使 用 的 '0' 、FALSE 和 LOW 也 可 以 相互 替换 。 

数字 抽象 (digital abstraction) 的 优势 在 于 设计 者 可 以 只 关注 0 和 1， 而 忽略 布尔 变量 的 物理 
表示 到 底 是 特定 的 电压 ， 还 是 旋转 的 齿轮 ， 或 者 是 液体 的 高 度 。 计 算 机 编程 人 员 不 需要 了 解 计 
算 机 硬件 的 细节 就 可 以 工作 。 此 外 ， 对 硬件 细节 的 理解 使 得 程序 员 可 以 针对 特定 计算 机 来 优化 
软件 。 

一 个 单独 位 并 没有 太 多 的 信息 。 下 一 节 将 用 一 组 位 来 表示 数字 ， 后 面 几 节 将 使 用 一 组 位 来 
表示 字母 和 程序 。 


1.4 Bil 


我 们 已 经 习惯 使 用 十 进 制 数字 。 但 在 由 0 和 1 组 成 的 数字 系统 ( digital system) P, Zi 
制 或 者 十 六 进 制 数字 使 用 起 来 更 方便 。 本 节 将 介绍 在 后 续 章 节 中 要 用 到 的 几 种 数 制 (number 


system ) 。 


1.4.1 十 进 制 数 

小 学 就 已 经 学 习 过 用 十 进 制 (decimal) 来 计数 和 做 算术 。 如 同 我 们 有 10 个 手指 一 样 ， 十 进 
制 也 是 由 0，1，2，…，9 这 10 个 数字 组 成 。 多 个 十 进 制 数字 组 合 在 一 起 可 以 形成 更 大 的 十 进 
制 数 。 在 十 进 制 数字 中 ， 每 一 列 的 权 都 是 前 一 列 的 10 倍 。 从 右 到 左 ， 每 一 列 的 权 分 别 为 1、 
10, 100, 1000 等 。 十 进 制 数 的 基 (base) 为 10。 基 往往 通过 数值 后 方 的 下 标 表示 ， 以 避免 与 原 
数值 混淆 。 例 如 ， 图 1-4 描述 了 十 进 制 数 9742,o 是 根据 每 一 列 的 权 与 该 列 的 数字 相 乘 后 求 和 而 
得 到 的 。 

一 个 N 位 的 十 进 制 数 表 示 10" 个 数字 中 的 某 一 个 : 0，1，2，3，…，10 -1， 称 为 数 的 表示 
范围 (range) 。 例 如 ， 一 个 3 位 的 十 进 制 数 表示 了 从 0 ~ 999 的 1000 个 数字 中 的 某 一 个 。 





i0=9 x 103+7x 10+4x 10!:+2x10° 
9 个 1000 ”7 个 100 4 个 10 2 个 1 





图 1-4 一 个 十 进 制 数 的 表示 


1.4.2 二 进 制 数 

1 位 表示 0 和 1 两 个 值 中 的 一 个 。 将 多 位 合并 在 一 起 就 形成 了 一 个 二 进 制 数 (binary num- 
ber) 。 二 进 制 数 的 每 一 列 的 权 都 是 前 一 列 的 2 倍 ， 因 此 二 进 制 数 的 基 是 2。 在 二 进 制 数 中 ， 每 
一 列 的 权 ( 从 右 到 左 ) 分 别 为 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 
8192 ，16384 ，32768 ，65536， 以 此 类 推 。 如 果 你 经 常 在 二 进 制 数 下 工作 ， 记 住 这 些 2"(n<16) 
会 节省 很 多 时 间 。 

一 个 N 位 二 进 制 数 代 表 2 ”个 数字 中 的 某 一 个 : 0, 1, 2, 3，…，2 -1。 表 1-1 显示 了 1 
位 、 2 位 .3 位 和 4 位 二 进 制 数 和 与 之 相等 的 十 进 制 数 。 


表 1-1 ”二进制 数 和 与 之 相等 的 十 进 制 数 


1 位 二 进 制 数 2 位 二 进 制 数 3 位 二 进 制 数 4 位 二 进 制 数 十 进 制 等 价值 
0 00 000 0000 0 
1 01 001 0001 1 

10 010 0010 2 
11 011 0011 3 
100 0100 4 

101 0101 5 

110 0110 6 

111 0111 7 

1000 8 

1001 9 

1010 10 

1011 11 

1100 12 

1101 13 

1110 14 


二 进 制 转 换 为 十 进 制 
将 二 进 制 数 10110, 转 换 为 十 进 制 。 
解 : 图 1-5 给 出 了 转换 方法 。 


1 个 16 0 个 8 1 个 4 1 个 2 0 个 1 





图 1-5 二 进 制 数 到 十 进 制 数 的 转换 4 


第 工 章 
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十 进 制 转换 为 二 进 制 

将 十 进 制 数 84,。 转 换 为 二 进 制 。 

m: 需要 判断 每 一 列 的 二 进 制 数值 是 1 还 是 0。 从 二 进 制 数 的 最 左 或 最 右边 都 可 以 进行 。 

从 左 开始 ， 首 先 从 小 于 给 定 十 进 制 数 的 2 的 最 高 次 究 开 始 (本 例 中 是 64)，84 宇 4， 因 此 
权 为 64 的 这 一 列 是 1， 还 剩 84 -64 =20。20 <32， 所 以 权 为 32 的 这 一 列 是 0。20 宇 16， 所 以 权 
为 16 的 这 一 列 是 1， 剩 下 20 -16 =4。4 <8， 所 以 权 为 8 的 这 一 列 是 0，4=4， 因 此 权 为 4 的 这 
—Fil- 1, 剩 下 4 -4 =0。 因 此 权 为 2 和 1 的 列 的 二 进 制 数值 均 为 0。 将 它们 组 合 在 一 起 ， 
84,, = 1010100,- 

从 右 开 始 ， 用 2 重复 除 给 定 的 十 进 制 数 ， 余 数 放 在 每 一 列 中 。84/2 =42， 因 此 权 为 1 的 这 一 
列 为 0。42/2 =21， 因 此 权 为 2 的 这 一 列 为 0。21/2 =10, 余数 是 1， 因 此 权 为 4 的 这 一 列 为 1。 
10/2=5， 权 为 8 的 这 一 列 为 0。5/2 =2， 余数 是 1， 权 为 16 的 这 一 列 为 1。2/2 =1， 权 为 32 的 这 
一 列 为 0。1/2 =0， 余数 是 1， 权 为 64 的 这 一 列 为 1。 从 而 84 = 1010100,。 < 


1.4.3 十 六 进 制 数 


书写 一 个 很 大 的 二 进 制 数 将 十 分 完 长 且 易 于 出 错 。4 位 一 组 的 二 进 制 数 可 以 表示 2 = 16 种 
数 。 因 此 ， 有 时 使 用 基数 为 16 的 表示 会 更 方便 ， 这 称 为 十 六 进 制 (hexadecimal ) 。 十 六 进 制 数 
使 用 数字 0 ~9 和 字母 A ~F， 如 表 1-2 所 示 。 十 六 进 制 数 每 一 列 的 权 分 别 是 1，16，16 (256 ) ， 
16 (4096) ， 以 此 类 推 。 


表 1-2 HKHH 


十 六 进 制 数 十 进 制 等 价值 二 进 制 等 价值 十 六 进 制 数 十 进 制 等 价值 二 进 制 等 价值 
0 0 0000 8 8 1000 
l 1 0001 9 9 1001 
2 2 0010 A 10 1010 
3 3 0011 B 11 1011 
4 4 0100 C 12 1100 
5 5 0101 D 13 1101 
6 6 0110 E 14 1110 
7 7 0111 F 15 1111 


十 六 进 制 转换 为 二 进 制 和 十 进 制 

将 十 六 进 制 数 2ED,。 转 换 为 二 进 制 和 十 进 制 。 

解 : 十 六 进 制 和 二 进 制 之 间 的 转换 很 容易 ， 其 中 每 个 十 六 进 制 数字 相当 于 4 位 二 进 制 数 
字 。2,。 =0010,，E,s =1110,; D,,=1101,, Flt 2ED,。=001011101101, 。 十 六 进 制 转换 为 十 进 
制 需要 计算 ， 图 1-6 给 出 了 计算 过 程 。 


Or 


zA 
Ze 
2E 


~=2 xX 16°+E x 16'+D x 16°=749,, 
275256 14416 1341 





图 1-6 十 六 进 制 到 十 进 制 的 转换 < 


一 进 制 转 换 为 十 六 进 抽 | 
将 二 进 制 数 1111010, 转 换 为 十 六 进 制 。 
解 : 转换 非常 容易 ， 从 右 往 左 读 取 数 据 , 4 个 最 低位 是 1010, =A,， 下 面 是 111, =7, E 


as 


此 1111010, =7Ai。 

十 进 制 转换 为 十 六 进 制 和 二 进 制 

将 十 进 制 数 333,。 转 换 为 十 六 进 制 和 二 进 制 。 

解 : 与 十 进 制 转换 为 二 进 制 一 样 ， 十 进 制 转换 为 十 六 进 制 可 以 从 堪 或 从 右 进行 。 

从 左 开始 ， 从 小 于 给 定 十 进 制 数 的 16 的 最 高 次 过 开始 (本 例 是 256) ，333 中 仅 包 含 了 1 个 
256， 所 以 在 权 为 256 的 这 一 列 是 1， 还 剩 333 -256 =77, 77 中 有 4 个 16， 所 以 在 权 为 16 的 这 一 
列 是 4， 还 剩 77 -16 x4 =13, 13; =De, 所 以 在 权 为 1 的 这 一 列 是 D。 因此 ， 33310 = 14D... 如 例 
1.3 所 示 ， 将 十 六 进 制 转换 为 二 进 制 是 很 容易 的 ，14D,。= 101001101, 。 

从 右 开 始 ， 用 16 重复 除 以 给 定 的 十 进 制 数 ， 余 数 放 在 每 一 列 中 。333716 = 20， 余 数 是 
13 =Die， 所 以 权 为 1 的 这 一 列 为 D。20/16 =1, 余数 为 4， 所 以 权 为 16 的 这 一 列 为 4。 
1/16 =0, 余数 是 1， 所 以 权 为 256 的 这 一 列 为 1。 最 后 ， 结 果 为 14D,。。 4 


1.4.4” 字 节 、 半 字 节 和 全 字 


8 位 的 一 组 称 为 字 节 (byte) ， 它 能 表示 2 =256 个 数字 。 在 计算 机 内 存 中 存储 数据 习惯 于 
用 字 市 作 单 位 ， 而 不 用 位 。 

4 位 的 一 组 或 者 半 个 字 节 称 为 半 字 节 (nibble) ， 它 能 表示 2 = 16 个 数字 。 一 个 十 六 进 制 数 
占用 1 个 半 字 节 ， 两 个 十 六 进 制 数 占 用 一 个 字 节 。 半 字 节 已 经 不 是 一 个 常用 的 单位 ， 但 这 个 术 
语 很 吸引 人 。 

微 处 理 器 处 理 的 一 块 数据 称 为 字 (word) 。 字 的 大 小 取决 于 微 处 理 咒 的 结构 。 在 写作 本 书 的 
2012 年 ， 很 多 计算 机 都 采用 64 位 处 理 器 ， 说 明 它 们 对 64 位 的 字 进 行 操 作 。 那 时 ， 处 理 32 位 
字 的 旧 计算 机 也 广泛 应 用 。 比 较 简 单 的 微 处 理 器 ， 特 别 是 应 用 在 烤 面包 机 等 小 设备 中 的 处 理 
ar, (EH 8 位 或 16 位 字 。 


在 一 组 位 中 ， 权 为 1 的 那 位 称 为 最 低 有 效 位 (least 19] 100 DEAFDAD8 
significant bit，lsb) ， 处 于 另 一 端的 位 称 为 最 高 有 效 位 ”局 。 局 和 ry 
( most significant bit，msb) ， 如 图 1-7a 所 示 的 6 位 二 进 ”有效 位 。 有 效 位 BRET “shia 
制 数 。 同 样 ， 对 于 一 个 字 来 说 ， 也 可 用 最 低 有 效 字 节 a) R3 
(Least Significant Byte, LSB) 和 最 高 有 效 字 节 ( Most 图 1-7 最 低 有 效 位 ( 字 节 ) 和 最 高 
Significant Byte，MSB ) 来 表示 ， 如 图 1-7b 所 示 。 该 图 有 效 位 ( 字 节 ) 


是 一 个 4 字 节 的 数据 ， 用 8 个 十 六 进 制 数 表示 。 

可 以 利用 一 个 很 方便 的 巧合 ， 2" =1024=10  。 因 此 kilo( 希腊 文 的 千 ) 表 示 2". flan, 2” 
字 节 是 1 千 字 节 (1KB) 。 相 似 地 ， 兆 ( 百 万 ) 表 示 2” =10',， 吉 ( 士 亿 ) 表 示 2 ”=10 。 如 果 你 知 
道 2 ~1 千 ,2”~1 兆 , 2”~1 吉 ， 而 且 记 住 2"(n<9) 的 值 ， 那么 你 将 很 容易 地 得 出 2 的 任意 
次 方 的 值 。 | 

估算 2 Hn RA 


不 用 计算 器 求 2* 的 近似 值 。 
解 : 将 指数 分 成 10 的 倍数 和 余数 。2”=22 x2 。22=1 兆 ,2 =16, Ase 2” ~16 Fk. $f 
确 地 说 ，2”=16777 216, 但 是 16 兆 这 个 数据 已 经 足够 精确 。 < 


1024 字 节 称 为 1 FFY (kilobyte, KB), 1024 位 称 为 1 F E44 (kilobit, Kb 或 Kbit) 。 类 似 
Hi, MB. Mb, GB 和 Gb 分 别 叫 作 兆 字 节 、 兆 比特 、 吉 字 节 和 圳 比特 。 内 存 容量 经 常用 字 节 做 


单位 ， 信 息 传输 速率 一 般 用 比特 / 秒 做 单位 。 例 如 ， 拨 号 的 调制 解 调 器 最 大 传输 速率 为 
56Kb/s. 


10 
15 


1.4.5 二 进 制 加 法 


二 进 制 加 法 与 十 进 制 加 法 相似 ， 但 它 更 简单 ， 如 图 1-8 所 示 。 在 十 进 制 加 法 中 ， 如 果 两 个 
数据 之 和 大 于 单个 数字 所 能 表示 的 值 ， 则 将 在 下 一 列 的 位 置 上 
标记 1。 图 1-8 比较 了 二 进 制 加 法 与 十 进 制 加 法 。 图 1-8a 的 最 右 





端的 一 列 ，7 +9 =16， 因 为 16 >9,， 所 以 不 能 用 单个 数字 表示 ， u < 二- 进位- 11 
因此 记录 权 为 工 的 列 结果 (6) ， 然 后 将 权 为 10 的 列 结果 (1) 进 ”47 EON 
位 到 更 高 的 一 列 中 。 同 样 ， 在 二 进 制 加 法 中 ， 如 果 两 个 数 相 一 9776 1110 
加 之 和 大 于 1, 那么 将 此 按 二 进 制 进位 到 更 高 的 一 列 。 如 a) 二进制 b) 十 进 制 


图 1-8b 所 示 ， 在 图 的 最 右 端 一 列 ，1 +1 =2,。=10,, 使 用 1 个 
二 进 制 位 无 法 表示 此 结果 ， 因 此 记录 此 和 中 权 为 1 的 列 结果 
(0) ， 并 将 权 为 2 的 列 结果 (1) 进 位 到 更 高 的 一 列 。 在 加 法 的 第 二 列 中 , 1 +1+1=3,=11,， 
记录 此 和 的 权 为 1 的 列 结果 (1)， 并 将 权 为 2 的 列 结果 (1) 进 位 到 更 高 的 一 列 。 为 了 更 明确 
地 表示 ， 进 位 到 相 邻 列 的 位 称 为 进位 (earry bit) 。 


1-8 显示 进位 的 加 法 示例 


二 进 制 加 法 O111 
计算 0111, +0101,。 a Net 


1100 


解 : 图 1-9 给 出 了 相 加 的 结果 1100,。 进 位 用 灰色 标 出 。 可 以 通 
过 计算 它们 的 十 进 制 来 检验 计算 结果 。0111, =7,, 0101, =5p, 结果 ”图 1-9 二 进 制 加 法 示例 
X 12 =1100,。 < 

数字 系统 常常 对 固定 长 度 的 数字 进行 操作 。 如 果 加 法 的 结果 太 大 ， 超 出 了 数字 的 表示 范 
围 ， 那 么 将 产生 溢出 (ovedlow) 。 例 如 ,一 个 4 位 数 的 表示 范围 是 [0，15] 。 如 果 两 个 4 位 数 相 
加 的 结果 超过 了 15 ， 那 么 就 会 产生 溢出 。 结 果 的 第 5 位 被 抛弃 ， 从 而 产生 一 个 不 正确 的 结果 。 
可 以 通过 检查 最 高 一 列 是 否 有 进位 来 判断 是 否 溢出 。 





GERD 有 溢出 的 加 法 0 

计算 1101, +0101, ， 有 没有 产生 溢出 ? + 0101 

解 : 图 1-10 给 出 了 计算 结果 是 10010, 。 此 结果 超出 了 4 位 二 ‘ities 
进 制 数 的 表示 范围 。 如 果 结 果 一 定 要 存储 为 4 位 的 二 进 制 数 ， 那 么 图 1-10 aH Bee 
它 的 最 高 位 将 被 抛弃 ， 剩 下 一 个 不 正确 的 结果 0010,。 如 果 计 算 结 法 示例 
果 使 用 5 位 或 更 多 位 来 表示 ， 结 果 10010; 将 是 正确 的 。 < 


1.4.6 有 符号 的 二 进 制 数 


到 目前 为 止 ， 我 们 只 考虑 了 表示 正 数 的 无 符号 (unsigned) 二 进 制 数 。 我 们 还 需要 一 种 能 表 
示 正 数 和 负数 的 二 进 制 。 有 多 种 方案 可 以 表示 有 符号 (signed) 二 进 制 数 ， 其 中 最 常用 的 两 种 
为 : 高 符号 的 原 码 和 补 码 。 

1. PHS HRB 

带 符 号 的 原 码 (sign/magnitude) 是 一 种 直观 的 数据 表示 方式 ， 符 合 我 们 写 负数 的 习惯 ， 把 
负 号 标 在 数字 前 面 。 在 一 个 N 位 带 符号 的 原 码 数 中 最 高 位 为 符号 位 ， 剩 下 的 W=- 1 位 为 数值 
(绝对 值 ) 。 符 号 位 为 0 表示 正 数 ，1 表示 负数 。 


带 符号 的 原 码 数 
用 带 符号 的 原 码 表示 5 和 -5。 
解 : 两 个 数字 的 值 均 为 5,,。=101,。 所 以 ,5,,。=0101,，-5,6 =1101,。 


不 笠 的 是 ， 普 通 的 二 进 制 加 法 无 法 在 带 符号 的 原 码 下 实现 。 例 如 ，- 5 和 Sio 相 加 ， 用 这 
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种 格式 计算 出 来 的 结果 是 1101, +0101, = 10010, ， 这 是 没有 道理 的 。 

N 位 的 带 符号 的 原 码 的 数据 表示 范围 是 [ -2" +1，2"- -1]。 这 种 格式 在 表示 0 时 有 两 
种 方法 : +0 和 -0。 同 一 个 数字 有 两 种 不 同 的 表示 方法 可 能 会 造成 麻烦 。 

2. 二 进 制 补 码 

二 进 制 补 码 中 最 高 位 的 权 是 -2 二 而 不 是 2- ， 其 他 位 的 表示 方法 与 无 符号 三 进 制 数 相 
同 。 它 克服 了 带 符号 的 原 码 格式 中 0 有 两 种 表示 方式 的 缺点 。 在 二 进 制 补 码 中 ，0 只 有 一 种 表 
示 方 式 ， 而 且 也 可 以 使 用 普通 的 加 法 。 

在 二 进 制 补 码 中 ，0 表示 成 00…000;。 正 数 的 最 高 位 为 0，01…111, =2"… -1。 负数 的 最 
高 位 是 1，10…000, = -2%', -1 表示 成 11…111;,。 

注意 ， 正 数 的 最 高 位 都 是 0， 负 数 的 最 高 位 都 是 1， 所 以 最 高 位 可 以 当 作 符号 位 ， 然 而 番 
余 位 的 解释 与 带 符号 的 原 码 有 所 不 同 。 

在 求 二 进 制 补 码 的 过 程 中 二 进 制 补 码 的 符号 位 保持 不 变 。 在 此 过 程 中 ， 首先 对 数据 的 每 一 
位 取 反 ， 然 后 在 数据 的 最 低位 加 1。 对 于 计算 负数 的 二 进 制 补 码 表示 或 根据 二 进 制 补 码 表示 计 
算 负数 的 值 这 是 很 有 用 的 。 

负数 的 二 进 制 补 码 表 示 

把 -2 表示 成 一 个 4 位 的 二 进 制 补 码 数 。 

解 : +20 = 0010;， 为 了 得 到 = 2 的 值 ， 将 所 有 位 取 反 后 加 1。0010; 取 反 后 为 1101;， 
1101, +1 =1110,, 所 以 -2,, =1110,. 4 

二 进 制 补 码 的 负数 的 值 

求 二 进 制 补 码 数 据 1001, 的 十 进 制 数 值 。 

解 : 1001, 的 最 高 位 是 1， 所 以 它 一 定 是 负数 。 为 了 求 它 的 值 , 将 所 有 位 取 反 然后 加 1。 
1001, 取 反 后 的 结果 是 0110,，0110, +1 =0111, =7,,, 所 以 ，1001, = -7,,. 4 

用 二 进 制 补 码 表示 的 数据 有 一 个 明显 的 优点 ， 加 法 对 正 数 和 负数 都 可 以 得 出 正确 的 结果 。 
当 进行 位 的 数据 加 法 时 ， 第 W 位 的 进位 ( 即 第 W+L 位 结果 ) 被 丢弃 。 

两 个 二 进 制 补 码 数据 相 加 

使 用 补 码 计算 (a) -2 +1w% 和 (b) -7。+7u 的 结果 

解 : (a) =2 o +1,, =1110, +0001, =1111, = -ls (b) -7 +749 = 1001, +0111, = 10000,, 
第 5 位 被 丢弃 ， 剩 下 后 4 位 的 结果 0000, . 4 

减法 是 将 第 二 个 操作 数 改变 符号 后 求 取 补 码 ， 然 后 与 第 一 个 操作 数 相 加 来 完成 。 

两 个 二 进 制 补 码 数据 相 减 

使 用 补 码 计算 (a)5。 -3 和 (b)3。-5o 的 结果 。 

解 : (a) 3,9 =0011, ， 取 二 进 制 补 码 得 -3,, =1101,, 计算 So + ( —3,9) =0101, +1101, = 
0010, =2,。。 注 意 ， 因 为 使 用 4 位 表示 结果 ， 所 以 其 最 高 位 的 进位 被 丢弃 。(b) 第 二 个 操作 数 
5io 取 补 码 得 -5, =1011 ， 计 算 3 各 二 9 =0011, +1011, =1110, = -2,,. < 

计算 0 的 二 进 制 补 码 时 ， 需 要 将 所 有 的 二 进 制 位 取 反 (产生 11…111, ) ， 然 后 加 15 丢弃 最 
高 位 ， 剩 余 00…000。 因 此 ，0 的 表示 是 唯一 的 。 与 带 符号 的 原 码 系统 不 同 ， 在 二 进 制 补 码 表 
示 方 法 中 没有 -0。0 被 认为 是 正 数 ， 因 为 它 的 符号 位 为 0。 

与 无 符号 数 一 样 ，W 位 二 进 制 补 码 数 能 够 表示 2 个 可 能 的 值 。 但 是 ， 这 些 值 分 为 正 数 和 负 
数 。 例 如 ， 一 个 4 位 的 无 符号 数 可 以 表示 16 个 数值 : 0~ 15。 一 个 4 位 的 二 进 制 补 码 也 可 以 表 
示 16 个 数值 : -8 ~7。 一 般 而 言 ，X 位 二 进 制 补 码 的 表示 范围 是 [ -2 ”“”，2””-1]。 注 意 负 
数 比 正 数 多 一 个 ， 因 为 没有 - 0。 最 小 的 负数 是 10…000, = - 2- 一， 这 个 数 有 时 叫 作 怪异 数 
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(weird number) 。 求 取 它 的 二 进 制 补 码 时 ， 首 先 各 位 取 反 变 成 01…111 ， 然 后 加 1， 变 成 10… 
000, ， 与 原 数 相同 。 因 此 ， 这 个 负数 没有 与 之 对 应 的 正 数 。 

两 个 W 位 正 数 或 者 负数 相 加 ， 如 果 结 果 大 于 2"- -1 或 者 小 于 -2"-， 则 会 产生 溢出 = 一 
个 正 数 和 一 个 负数 相 加 肯定 不 会 导致 溢出 。 与 无 符号 整数 加 法 不 同 ， 最 高 位 产生 进位 表示 溢 
出 。 在 二 进 制 补 码 加 法 中 ， 判 定 溢 出 的 条 件 是 : 如 果 相 加 两 个 数 的 符号 相同 且 结 果 的 符号 与 被 
加 数 的 符号 相反 ， 则 表示 发 生 溢出 。 

有 溢出 的 二 进 制 数 加 法 

用 4 位 二 进 制 数 计算 4o +5o。 判 断 结果 是 否 有 溢出 。 

解 : 4o +5, =0100, +0101, =1001, = -7u。 结 果 超 过 了 4 位 二 进 制 补 码 整数 的 表示 范围 ， 
产生 了 不 正确 的 负 值 结果 。 如 果 计算 使 用 5 位 或 更 多 位 数 ， 则 结果 为 正确 的 值 01001, =9,,. < 

当 二 进 制 补 码 数 扩展 到 更 多 位 数 时 ， 需 要 将 符号 位 复制 到 所 有 的 扩展 高 位 中 。 这 个 过 程 称 
为 符号 扩展 (sign extension) 。 例 如 ， 数 字 3 和 -3 的 二 进 制 补 码 表示 分 别 为 0011 和 1101。 将 这 
两 个 数 扩展 为 7 位 时 ， 可 以 将 符号 位 复制 到 新 的 高 3 位 中 ， 分 别 得 到 0000011 和 1111101。 

数 制 的 比较 


3 种 最 常见 的 二 进 制 分 别 为 : 无 符号 数 、 二 进 制 补 码 和 带 符号 的 原 码 。 表 1-3 比较 了 这 3 
种 系统 中 N 位 数 的 表示 范围 。 由 于 二 进 制 补 码 可 以 表 表 1-3 NN 位 数 的 表示 范围 

示 正 数 和 负数 ， 而 且 可 以 使 用 普通 的 加 法 ， 所 以 这 种 一 一 srr) 
编码 方式 最 为 方便 。 减 法 采用 将 减 数 取 反 (也 采用 二 “无 符号 的 原 码 (0, 2 | 
进 制 补 码 ) 再 与 被 减 数 相 加 的 方法 实现 。 除 非特 殊 声 。 ” 带 符号 的 原 码 bre Ri] 
明 ， 和 否则 我 们 都 使 用 二 进 制 补 码 表 示 有 符号 数 。 Seba Das ana O 

图 1-11 给 出 了 每 个 数 制 中 4 位 数 的 表示 方法 。 

无 符号 数 在 [0，15] 范围 内 按照 正常 的 二 进 制 顺序 排列 。 二 进 制 补 码 表示 范围 为 [ -8，7]。 其 
中 非 负数 [0，7] 的 编码 与 无 符号 数 相 同 ， 负 数 [ -8，-1] 中 越 大 的 二 进 制 数 越 接 近 0。 注 意 ， 
怪异 数 1000 表示 -8 ， 没 有 正 数 与 之 对 应 。 带 符号 的 原 码 的 表示 范围 为 [ -7，7] 。 最 高 位 为 符 
号 位 。 正 数 [1，7] 的 编码 与 无 符号 数 相同 。 负 数 表 示 与 整数 对 称 ， 而 只 是 符号 位 为 1。0 可 以 
表示 为 0000 或 1000。 由 于 0 有 两 种 表示 方法 ， 所 以 N 位 带 符号 的 原 码 仅 可 以 表示 2”- 1 个 数 。 


AF) eg CR) eg ES i a PAS Gee BLS = 10 Aha E 


无 符号 的 原 码 0000 0001 0010 0011 0100 0101 0110 O111 1000 1001 1010 1011 1100 1101 1110 1111 
1000 1001 1010 1011 1100 1101 1110 1111 0000 0001 0010 0011 0100 0101 0110 0111 二 进 制 补 码 
0000 
1111 1110 1101 1100 1011 1010 1001 1000 0001 0010 0011 0I00 0101 0110 OLI 带 符号 的 原 码 


图 1-11 4 位 二 进 制 数 编码 
1.5 逻辑 门 

既然 我 们 已 经 知道 如 何 使 用 二 进 制 变量 来 表示 信息 ， 下 面 我 们 将 研究 对 这 些 二 进 制 变量 进 
行 操作 的 数字 系统 。 远 辑 门 (logic gate) 是 最 简单 的 数字 电路 ， 它 们 可 以 接收 一 个 或 多 个 二 进 制 
输入 并 产生 一 个 二 进 制 输出 。 逻 辑 门 用 表示 出 输入 和 输出 的 符号 画 出 。 输 入 通常 画 在 左边 (或 


上 部 ) ， 输 出 通常 画 在 右边 (或 下 部 ) 。 数 字 设计 师 通常 使 用 字母 表 开始 部 分 的 字母 表示 门 的 输 
入 ， 用 YY 表示 门 的 输出 。 输 入 和 输出 之 间 的 关系 由 真 值 表 或 布尔 表达 式 描 述 。 真 值 表 (truth ta- 
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ble) 的 左边 列 出 输入 ， 右 边 列 出 对 应 的 输出 ， 而 且 每 种 可 能 的 输入 组 合 对 应 一 行 。 布 尔 表 达 式 
( Boolean equation ) 是 基于 二 进 制 变量 的 数学 表达 式 。 


1.5.1 非 门 


非 门 (NOT gate) 有 一 个 输入 A 和 一 个 输出 Y， 如 图 1-12 所 示 。 非 门 的 输出 是 输入 的 反 。 如 
果 4 为 FALSE， 则 了 为 TRUE。 如 果 4 为 TRUE， 则 了 为 FALSE。 这 个 关系 由 图 中 的 真 值 表 和 
布尔 表达 式 所 表示 。 布 尔 表 达 式 中 4 上 面 的 横 线 读 作 NOT, Ke Y=4 读 作 “YY 等 于 NOT A”, 
非 门 也 称 为 反 相 器 (inverter) 。 

还 有 一 些 对 非 逻辑 的 表示 ， 例 如 Y=4'、Y=-4、Y=! 4 或 Y= ~4。 我 们 仅 使 用 了 = 4， 
但 读者 在 碰 到 其 他 类 型 的 表示 时 也 不 要 被 迷惑 。 


1.5.2 mhs 


另 一 种 单 输入 逻辑 门 称 为 缓冲 器 (buffer) ， 如 图 1-13 所 示 。 它 仅仅 将 输入 复制 到 输出 。 

从 逻辑 的 角度 看 ， 组 冲 器 与 电线 没有 差异 ， 好 像 没 有 用 。 然 而 ， 从 模拟 电路 的 角度 看 ， 绥 
冲 器 可 能 有 一 些 很 好 的 特征 使 得 它 可 以 向 发 动机 传递 大 电流 ， 或 者 将 输出 更 快 地 传递 到 多 个 门 
的 输入 上 。 这 个 例子 也 说 明了 为 什么 我 们 要 考虑 整个 系统 的 多 个 层次 抽象 。 数 字 抽 象 掩盖 了 组 
冲 区 的 真实 作用 。 

三 角 符 号 表示 一 个 缓冲 器 。 输 出 上 的 圆圈 称 为 气泡 (bubble) ， 用 来 表示 取 反 ， 与 图 1-12 中 
的 非 门 符号 一 样 。 
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两 输入 逻辑 门 更 加 有 趣 。 图 1-14 中 的 与 门 ( AND gate) 在 所 有 输入 4 和 B 都 为 TRUE 时 ， 
输出 了 才 为 TRUE。 否则 输出 为 FALSE。 为 了 方便 起 见 ， 输 入 按照 00、01、10、11 的 二 进 制 递 
增 顺序 排列 。 与 门 的 布尔 表达 式 可 以 写成 多 种 方式 : Y=A+B. Y=ABRAY=ANB, HPS 
站 读 作 “intersection”( 交 ) ， 常 常 由 逻辑 学 家 使 用 。 我 们 更 常用 Y=4B, 读 作 “Y 等 于 4 与 B”。 


1.5.4 | 


图 1-15 中 的 或 门 (OR gate) 中 只 要 输入 4 和 B 中 有 一 个 为 TRUE; 输出 了 就 为 TRUE。 I] 
的 布尔 表达 式 可 以 写 为 : Y=A4+B 或 者 Y=AUB。 其 中 符号 U 读 作 “union”( 并 )， 常常 由 逻 
辑 学 家 使 用 。 数 字 电路 工程 师 更 常 使 用 了 =4 +B, 读 作 “Y 等 于 4 或 B”。 





NOT BUF 
AT {>r 
Y=A Y=A A 
0 0 
A y A Y 0 1 
0 1 0 0 1 0 
al 0 1 1 1 1 
图 1-12 非 门 图 1-13 缓冲 区 图 1-14 与 门 图 1-15 或 门 


1.5.5 其 他 两 输入 逻辑 门 


1-16 给 出 了 其 他 常见 的 两 输入 逻辑 门 。 异 或 门 (exclusive OR, XOR) 的 输入 4 A BPA 
且 仅 有 一 个 输入 为 TRUE 时 ,输出 为 TRUE。 如 果 门 后 面 有 一 个 气泡 ， 则 表示 取 反 操作 。 与 非 
(NAND) 门 执行 与 非 操作 。 它 的 所 有 输入 为 TRUE 时 输出 才 为 FALSE， 其 他 情况 输出 都 为 
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TRUE, 或 非 ( NOR ) 门 执行 或 非 操 作 。 它 在 输入 4 和 B 都 不 为 TRUE 时 才 输 出 TRUE。N 输 入 异 
或 (XOR) 门 有 时 也 称 为 奇偶 校 验 (parity) 门 ， 当 有 奇数 个 输入 为 TRUE 时 输出 为 TRUE。 与 两 输 
入 门 一 样 ， 真 值 表 中 的 输入 组 合 按照 二 进 制 递增 顺序 排列 。 


XOR NAND 
4 
B 





图 1-16 其 他 两 输入 逻辑 门 


XNOR 门 

1-17 给 出 两 输入 XNOR 门 的 电路 符号 和 布尔 表达 式 。 它 执行 异 或 非 逻 辑 。 请 完成 真 值 表 。 

解 : 图 1-18 给 出 了 真 值 表 。 如 果 所 有 输入 都 为 TRUE 或 FALSE， 则 XNOR 输出 TRUE, Bi 
输入 XNOR 门 有 时 称 为 相等 (equality ) 门 ， 因 为 在 输入 相等 时 输出 为 TRUE。 





图 1-17 XNOR 门 图 1-18 XNOR 门 的 真 值 表 < 


1.5.6 多 输入 门 


有 很 多 需要 三 个 或 三 个 以 上 输入 的 布尔 函数 。 最 常见 的 是 AND, OR, XOR, NAND, NOR 
和 XNOR。N 输 入 与 门 在 所 有 输入 都 为 TRUE 时 才 输 出 TRUE。NN 输入 或 门 在 至 少 有 一 个 输入 为 
TRUE 时 就 产生 TRUE。 
三 输入 NOR 门 
图 1-19 给 出 了 三 输入 NOR 门 的 电路 符号 和 布尔 表达 式 。 请 完成 真 值 表 。 
解 : 图 1-20 给 出 了 真 值 表 。 只 有 在 所 有 输入 都 不 为 TRUE 时 ， 输 出 才 为 TRUE。 
NOR3 





A 
0 
0 
0 
0 
1 
1 
1 
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图 1-19 三 输入 NOR 门 图 1-20 三 输入 NOR 门 的 真 值 表 < 
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四 输入 AND 门 
图 1-21 给 出 四 输入 AND 的 电路 符号 和 布尔 表达 式 。 请 完成 真 值 表 。 
解 : 图 1-22 给 出 了 真 值 表 。 只 有 在 所 有 输入 都 为 TRUE 时 ， 输 出 才 为 TRUE。 
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图 1-21 四 输入 AND 门 图 1-22 ”四 输入 AND 门 的 真 值 表 < 
1.6 数字 抽象 


数字 系统 采用 离散 值 变量 。 然 而 这 些 变 量 需 要 由 连续 的 物理 量 来 表示 ， 例 如 电线 上 的 电 
压 、 齿 轮 的 位 置 或 者 桶 中 的 水 位 高 度 等 。 所 以 ,设计 者 必须 找到 一 种 将 连续 变量 和 离散 变量 联 
系 在 一 起 的 方法 。 

例如 ， 考 虑 用 二 进 制 信号 A 来 表示 电线 上 的 电压 。 当 电压 为 OV 时 , A=0; ASV, A= 
1。 任何 实际 系统 都 必须 能 容忍 一 定 的 噪声 ， 因 此 4.97V 可 能 也 可 以 解释 为 4=1。 但 是 对 于 
4.3V 呢 ? 对 于 2.8V 或 2.500 000V 呢 ? 


1.6.1 电源 电压 


假设 系统 中 的 最 低 电 压 为 OV， 称 为 地 ( ground，GND)。 系 统 中 的 最 高 电压 来 自 电 源 ， 常 称 
H Voo 在 20 世纪 70 ~80 年 代 的 技术 下 ，ym 一 般 为 5SV。 随 着 芯片 采用 了 更 小 的 晶体 管 ，m 
降 到 了 3.3V、2.5V、1.8V、1.5V、1.2V， 其 至 更 低 以 便 减少 功 耗 和 避免 晶体 管 过 载 。 


1.6.2 ZRF 


通过 定义 逻辑 电 平 (logic level) ， 可 以 将 连续 变量 映射 到 离散 的 二 进 制 变量 ， 如 图 1-23 所 
示 。 第 一 个 门 称 为 驱动 源 (driver) ， 第 二 个 门 称 为 接收 端 (receiver) 。 驱 动 源 的 输出 连接 到 接收 
端的 输入 。 驱 动 源 产 生 LOW(0) 输 出 ， 其 电压 处 于 0 ~ Vo 之 间 ; 或 者 产生 HIGH(1) 输 出 ， 其 电 
压 处 于 Von ~ Tu 之 间 。 如 果 ， 接 收 端 的 输入 电压 处 于 0 ~ 万 之 间 ， 则 接收 端 认 为 其 输入 为 
LOW, QR Eo HY A HE EAR Viu ~ Jp 之 间 ， 则 接收 端 认 为 其 输入 为 HIGH, WR h FIR 
声 或 部 件 错误 ， 接 收 端的 输入 电压 处 于 ~ WV, 之 间 的 禁止 区 域 (forbidden zone), ， 则 输入 门 的 
行为 不 可 预测 。VYos 和 Ji, 称 为 输出 高 和 输出 低 逻 辑 电 平 ，Wo 和 Vi 称 为 输入 高 和 输入 低 人 逻辑 
电 平 。 


1.6.3 噪声 容 限 


如 有 果 驱 动 源 的 输出 能 够 被 接收 端的 输入 正确 解释 ， 则 必须 选择 Vor < Va MI Von > Vino E 
此 ， 即 使 驱动 源 的 输出 被 一 些 噪声 干扰 ， 接 收 端的 输入 依然 能 够 检测 到 正确 的 逻辑 电 平 。 可 
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以 加 在 最 坏 情 况 输 出 上 但 依然 能 正确 解释 为 有 效 输入 的 噪声 值 ， 称 为 骂 声 容 限 ( noise margin) 。 
从 图 1-23 中 可 以 看 出 ， 低 电 平和 高 电 平 的 噪声 容 限 分 别 为 : 


NM, = V,, - Vo (1-2) 
NM, = Vou 一 Vin (1-3) 
了 驱动 源 FEC 


输出 特征 





图 1-23 ”逻辑 电 平和 噪声 容 限 


计算 噪声 容 限 噪声 

考 上 图 1-24 中 的 反 相 名 电路 。Vu 是 反 相 器 1 的 输出 om \ n = 
EJE, VERIR L 的 输入 电压 。 两 个 反 向 器 遵循 同样 
的 逻辑 电 平 特征 ; Vo =5V, Va =1.35V, V,, =3.15V, 图 1-24 反 相 器 电路 
Vo, =0. 33V, Voy =3.84V。 反 相 器 的 低 电 平和 高 电 平 噪声 
容 限 分 别 为 多 少 ? 这 个 电路 可 否 承受 Vo A Vo ZE 1V 的 噪声 ? 

fi: 反 相 器 的 噪声 容 限 为 : NM, =V, -Vo = (1.35V -0.33V) =1.02V, NM, = Voy - Vu = 
(3.84V -3.15V) =0.69V。 电 路 在 输出 为 LOW 时， 可 以 承受 1V 的 噪声 电压 (NM =1.02V); 
但 在 输出 为 HIGH 时 ， 不 能 承受 此 噪声 电压 (NM = 0.69V)。 例 如 ， 假 设 驱动 源 7, 输出 的 
HIGH 值 处 于 最 坏 情况 ，V。, = Von =3.84V。 如 果 噪 声 导致 电压 在 到 达 接 收 端 输入 前 降低 了 1V, 
Vo = (3. 84V -1V) =2. 84V。 这 已 经 小 于 可 接受 的 HIGH 逻辑 电 平 Vis =3.15V， 因 此 接收 端 将 
无 法 检测 到 正确 的 HIGH 输入 。 s 


1.6.4 直流 电压 传输 特性 


为 了 理解 数字 抽象 的 局 限 性 ， 我 们 必须 深入 考察 门 的 模拟 行为 。 门 的 直流 电压 传输 特性 摘 
述 了 当 输 入 电压 变化 足够 慢 且 保证 输出 能 跟 上 输入 的 变化 时 ， 输 出 电压 随 输入 电压 变化 的 函数 
关系 。 这 个 函数 称 为 传输 特性 ， 因 为 它 描述 了 输入 和 输出 电压 之 间 的 关系 。 

理想 的 反 相 器 应 在 输入 电压 达到 门限 Vor2 时 产生 一 个 跳 变 ， 如 图 1-25a 所 示 。 对 于 
V(A) <Vop/2, VOY) =V XEF VCA) >Vpp/2, VOY) =0, BERT, Vi = WV = Vp/2; Vou = Von 
H Va =0. 

真实 的 反 相 器 在 两 个 极端 之 间 变 化 得 更 缓慢 一 些 ， 如 图 1-25b 所 示 。 当 输入 电压 V(4) 
等 于 0 时 ,输出 电压 V(Y) =V,,. 4 V(A) = oo 时 ，XY(Z =0。 然 而 ， 这 两 个 端 氮 之 间 的 变 
化 是 平滑 的 ， 而 且 可 能 并 不 会 恰恰 在 中 点 Vio/2 突变 。 这 就 产生 了 如 何 定 义 逻辑 电 平 的 
问题 。 

一 种 选择 逻辑 电 平 的 合理 方法 是 选择 在 传输 特征 曲线 斜率 dV(Y)AdV(4) 为 -1 的 位 置 。 这 
两 个 位 置 称 为 单位 增益 点 (unity gain point) 。 在 单位 增益 点 选择 逻辑 电 平 可 以 最 大 化 噪声 容 限 。 
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如 果 让 减少 ，Yon 将 仅仅 增加 一 点 。 如 果 Vi SPI, Von MEE EEE. 


V(Y) V(Y) 
A Too Y 





Vou pp 
Vo. 0 V(A) | 
Vop/2 Vop Vin Vm Von 
Vis Vin 
a) b) 
图 1-25 直流 传输 特性 和 逻辑 电 平 
1.6.5 静态 约束 


为 了 避免 输入 落 到 禁止 区 域 ， 数 字 逻 辑 门 的 设计 需要 遵循 静态 约束 (static discipline), i 
态 约束 要 求 ， 对 于 给 定 的 有 效 逻 辑 输 入 ， 每 个 电路 元 件 应 该 能 产生 有 效 的 逻辑 输出 。 

为 了 满足 静态 约束 ， 数 字 电 路 设计 人 员 需 要 牺牲 使 用 任意 模拟 电路 元 件 的 自由 ， 但 是 换 来 
了 数字 电路 的 简单 性 和 可 靠 性 。 通 过 从 模拟 到 数字 之 间 抽 象 层 次 的 提高 ， 可 以 隐藏 无 需 了 解 的 
细节 来 提高 设计 生产 率 。 | 

op 和 逻辑 电 平 可 以 任意 选择 ， 但 是 所 有 相互 通信 的 逻辑 门 必 须 保 持 兼容 的 逻辑 电 平 。 因 
此 ， 逻 辑 门 可 以 按照 逻辑 系列 (logic family) 来 区 分 ， 其 中 同一 逻辑 系列 的 所 有 门 都 遵循 相同 的 
静态 约束 。 同 一 逻辑 系列 中 的 逻辑 门 像 积木 一 样 组 合 在 一 起 ， 使 用 相同 的 电源 电压 和 逻辑 
电 平 。 

20 世纪 70 年代 ~90 年 代 有 4 种 主流 的 逻辑 系列 : TTL( Transistor- Transistor Logic, fake 
— fn {AF 2 44) ，CMOS( Complementary Metal- Oxide- Semiconductor Logic， 互 补 性 金属 - 氧化 物 
-半导体 逻辑 ) | LVTTL( Low Voltage TTL, (REE TTL) 和 LVCMOS(Low Voltage CMOS, {fF He 
CMOS). # 1-4 比较 了 它们 的 逻辑 电 平 。 随 着 电源 电压 的 不 断 降低 ， 不 断 分 化 出 新 的 逻辑 系 
列 。 附 录 A. 6 更 加 详细 地 讨论 了 常见 的 逻辑 系列 。 


表 1-4 5V 和 3. 3V 逻辑 系列 的 逻辑 电 平 


逻辑 系列 Vpp Vin Vin Vo. Vou 
TTL 5(4. 75 —5. 25) 0.8 2.0 0.4 2.4 
CMOS 5(4.5 -6) 1.35 3.15 0. 33 3. 84 
LVTTL 3.3(3 -3.6) 0.8 2.0 0.4 2.4 
LVCMOS 3. 3(3 -3.6) 0.9 1.8 0. 36 ET 


逻辑 系列 兼容 性 
表 1-4 中 的 哪些 逻辑 系列 可 以 可 靠 地 与 其 他 逻辑 系列 通信 ? 
解 : 表 1-5 列举 了 逻辑 系列 之 间 的 兼容 性 。 注 意 ，5V 的 TTL BK CMOS 逻辑 系列 可 能 产生 
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的 HIGH 信号 输出 电压 为 5V。 如 果 5V 信号 驱动 3.3V 的 LVTTL 或 LVCMOS 逻辑 系列 输入 ,可 
能 会 损坏 接收 端 ， 除 非 接 收 端 特殊 设计 为 “5V 兼容 ”。 


表 1-5 逻辑 系列 之 间 的 兼容 性 


接收 端 
TTL CMOS LVTTL LVCMOS 
驱动 源 TTL 兼容 AIRE: Von < Vin 可 能 兼容 2 可 能 兼容 了 
CMOS 兼容 兼容 可 能 兼容 可 能 兼容 了 
LVTTL 兼容 不 兼容 : Von < Vin 兼容 兼容 
LVCMOS 兼容 不 兼容 : Vou < Vin 兼容 REG 
只 要 5V 高 电 平 不 会 损害 接收 端 输 入 。 < 


1.7 CMOS 晶体 管 * 


本 节 和 后 续 带 的 章节 是 可 选 的 。 它 们 对 理解 本 书 的 核心 内 容 并 不 重要 。 

Babbage 的 分 析 机 由 齿轮 构造 ， 早 期 的 电子 计算 机 由 继电器 和 真空 管 构成 。 现 代 计 算 机 则 
由 廉价 的 、 微 型 的 和 可 靠 的 晶体 管 构成 。 蝇 体 管 (transistor) 是 一 个 电子 的 可 控 开 关 。 当 由 电压 
或 者 电流 施加 到 控制 端 时 ， 它 将 在 ON( 导 通 ) 和 OFF( 截 止 ) 之 间 切 换 。 品 体 管 有 两 大 类 : 双 极 
晶体 管 (bipolar junction transistor) 和 金属 -氧化 物 -半导体 场 效 应 晶体 管 (Metal-Oxide-Semicon- 
ductor field effect transistor, MOSFET 或 MOS ) 。 

1958 年 ， 德 州 仪器 (Texas Instrument) 的 Jack Kilby 制造 了 第 一 个 具有 两 个 晶体 管 的 集成 电 
路 。1959 年 ， 仙 童 半 导体 (Fairchild Semiconductor) 的 Robert Noyce 申请 了 在 一 个 硅 心 片 上 连接 
多 个 晶体 管 的 专利 。 在 那个 年 代 ， 每 个 晶体 管 的 造价 是 10 美元 。 

半导体 制造 技术 经 过 三 十 多 年 的 空前 进步 ， 人 们 已 经 可 以 在 一 个 lem 的 芯片 上 集成 10 亿 
个 MOS 晶体 管 ， 而 每 个 晶体 管 的 造价 已 经 低 于 10“ 美 分 。 集 成 度 和 价格 每 8 年 左右 改进 一 个 
数量 级 。MOS 晶体 管 现在 已 经 用 于 构造 几乎 所 有 的 数字 电路 系统 。 本 节 中 ,我 们 将 进入 电路 
抽象 层 以 下 ， 来 看 看 如 何 使 用 MOS 品 体 管 构造 逻辑 门 。 


1.7.1, “BS 


MOS 晶体 管 由 岩石 和 沙子 中 的 最 主要 元 素 一 一 硅 ， 构 成 。 硅 (Silicon，Si) 是 第 IV HICH, 
因此 其 化 合 价 外 层 有 4 个 电子 ， 并 与 4 个 相 邻 元 素 紧 密 连 接 ， 形 成 晶 格 (lattice) 。 图 1-26a fa 
化 显示 了 二 维 晶 格 ， 但 晶 格 实际 上 形成 立方 晶体 。 在 图 中 线 表示 共 价 键 。 在 此 结构 下 ， 因 为 所 
有 电子 都 束缚 在 共 价 键 中 ， 所 以 硅 的 导电 性 很 弱 。 但 是 ， 如 果 在 其 中 加 入 少量 杂质 ， 称 为 掺 杂 
原子 (dopant atom) ， 则 硅 的 导电 性 就 会 大 大 提高 。 如 果 加 入 第 VRIR Ain, m, As), £ 
杂 原 子 就 会 有 一 个 额外 的 电子 不 受 共 价 键 的 束缚 。 这 个 电子 可 以 在 品格 中 目 由 移动 ， 而 留 下 一 
个 带 正 电 的 掺 杂 原 子 ( As* ) ， 如 图 1-26b 所 示 。 由 于 电子 带 有 人 负 电荷， 所 以 我 们 称 砷 为 n BB 
杂 原 子 。 另 一 方面 ， 如 果 摊 和 人 II 族 元 素 (例如 ， 硼 ，B)， 掺 杂 原 子 就 失去 一 个 电子 ， 如 图 1- 
26c 所 示 。 失 去 的 电子 称 为 空 穴 (hole)。 与 掺 杂 原 子 邻 近 的 硅 原 子 可 以 移动 一 个 电子 过 来 来 填 
充 共 价 键 ， 产 生 一 个 带 负电 荷 的 摊 杂 原子 (B )， 并 在 邻近 硅 原 子 中 产生 空 穴 。 类 似 地 ， 空 六 
可 以 在 晶 格 中 迁移 。 空 穴 缺 少 一 个 负电 荷 ， 所 以 与 一 个 具有 正 电 的 粒子 相似 。 因 此 ， 我 们 称 硼 
H p 型 挨 杂 原子 。 因 为 挫 杂 浓度 发 生变 化 ， 硅 的 导电 性 可 以 相差 好 几 个 数量 级 ， 所 以 硅 称 为 半 
导体 ( semiconductor ) 。 
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图 1-26 Emt ARET 
1.7.2 二 极 管 


p 型 硅 和 n 型 硅 之 间 的 连接 点 称 为 二 极 管 (diode) 。p 型 区 cue omen 
域 称 为 阳极 (anode) ，n 型 区 域 为 阴极 (cathode)， 如 图 1-27 所 


示 。 当 阳极 的 电压 高 于 阴极 时 ， 二 极 管 处 于 正 向 偏 压 ， 电 流 从 阳 Seid ay 
极 流向 阴极 。 当 阳极 的 电压 低 于 阴极 时 ， 二 极 管 处 于 反 向 偏 压 ， 
没有 电流 。 二 极 管 符号 直观 地 表示 了 电流 只 能 沿 一 个 方向 流动 。 图 1-27 ”基于 p -n 结 的 二 极 管 
| 结构 和 电路 符号 
1.7.3 -电容 
电容 (capacitor) 由 夹 着 绝缘 体 的 两 个 导体 构成 。 当 电压 V bs 
加 到 电容 一 端的 导体 时 ， 这 个 导体 将 积累 电荷 0， 而 另 一 端 导 sais 


体 将 积累 负电 荷 -QO. HAM EAE C( capacitance) 是 电压 和 充 图 1-28 电容 符号 
电 电 荷 之 比 : C = QAV。 电 容量 正比 于 导体 的 尺寸 ， 反比 于 导体 
之 间 的 距离 ， 电 容 的 符号 如 图 1-28 所 示 。 
电容 之 所 以 重要 是 因为 导体 的 充电 或 放电 需要 时 间 和 能 量 。 大 电容 意味 着 电路 比较 慢 ， 
而 且 需 要 更 多 的 能 量 。 速 度 和 能 量 问题 将 在 本 书 中 进一步 讨论 。 


1.7.4 nMOS 和 pMOS 晶体 管 


MOS 晶体 管 由 多 层 导 体 和 绝缘 体 构成 。MOS 晶体 管 在 直径 15 ~ 30 JEX (cm) FY dh Æ ( wa- 
fer) 上 制造 。 制 造 过程 从 一 个 裸 唱 元 开始 ， 包 括 挫 杂 原子 的 注入 、 氧 化 硅 膜 的 生长 和 金属 的 省 
积 等 多 个 步 又。 在 每 个 步骤 之 间 ， 唱 元 将 形成 特定 图 形 使 得 只 有 需要 的 部 分 暴露 在 外 部 。 由 于 
晶体 管 的 尺寸 仅 有 微米 (10“m) ， 且 一 次 可 以 处 理 整个 晶 元 ， 所 以 一 次 制作 几 十 亿 个 晶体 管 的 
成 本 并 不 高 。 一 旦 处 理 结束 ， 唱 元 将 被 切割 成 很 多 长 方形 的 部 分 ， 称 为 芯片 (chip 或 dice) ， 每 
个 部 分 包含 了 成 千 上 万 ， 甚 至 10 亿 个 晶体 管 。 这 些 世 片 经 过 测试 后 ， 将 芯片 封装 在 塑料 或 陶 
瓷 中 ， 并 通过 金属 引 脚 连接 到 电路 板 上 。 

MOS 晶体 管 中 最 底层 是 硅 晶 元 衬 底 (substrate) ， 最 项 上 是 导电 的 栅 极 ( gate)， 中 间 是 由 二 
氧化 硅 ( Si0, ) 构成 的 绝缘 层 。 过 去 栅 极 是 由 金属 构造 的 ， 因 此 它 被 称 为 金属 -氧化 物 -FF 
体 。 现 在 栅 极 的 制造 工艺 采用 多 唱 硅 ， 以 便 避 免 金属 在 后 续 的 处 理工 艺 中 融化 。 二 氧化 硅 常 用 
于 制造 玻璃 ， 在 半导体 工业 中 它 简称 为 氧化 物 (oxide)。MOS 结构 中 ， 金 属 与 半导体 衬 底 之 间 
的 极 薄 的 二 氧化 硅 绝 缘 层 (dielectric ) 形 成 一 个 电容 。 

现 有 两 类 MOS 晶体 管 : nMOS 和 pMOS。 图 1-29 给 出 了 从 侧面 观察 它们 的 截面 图 。n 
型 晶体 管 称 为 nMOS， 它 在 5 型 半导体 衬 底 上 有 与 栅 极 (分 别称 为 源 极 (source) 和 漏 极 


(drain) ) 相连 的 n 类 型 摊 杂 区 域 。pMOS 晶体 管 则 相反 ， 在 nm 型 衬 底 上 构造 p 型 源 极 和 漏 
极 区 域 。 
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图 1-29 nMOS 和 pMOS 晶体 管 


MOS 晶体 管 是 一 个 由 电压 控制 的 开关 : 栅 极 电压 产生 一 个 使 得 源 极 和 漏 极 之 间 的 连接 处 
于 ON( 导 通 ) 或 OFF( 截 止 ) 状 态 的 电场 。 场 效应 晶体 管 正 是 来 源 于 这 个 操作 原理 。 下 面 让 我 们 
继续 研究 nMOS 晶体 管 的 操作 过 程 。 

nMOS 晶体 管 的 衬 底 一 般 都 连接 到 地 (系统 中 的 最 低 电 压 ) 。 首 先 考 虑 当 栅 极 电压 为 0V 的 
情况 ， 如 图 1-30a 所 示 。 由 于 源 极 或 漏 极 的 电压 大 于 0， 所 以 它们 和 衬 底 之 间 的 二 极 管 处 于 反 
向 偏 压 状 态 。 因 此 此 时 源 极 和 漏 极 之 间 没 有 电流 ， 唱 体 管 处 于 截止 (OFF ) 状态 。 接 着 考虑 当 栅 
极 电压 为 Vov 的 情况 ， 如 图 1-30b 所 示 。 当 正 电压 加 在 电容 的 上 表面 时 ， 将 建立 一 个 电场 并 在 
上 表面 吸收 正 电 荷 ， 在 下 表面 吸收 负电 和 荷 。 当 电压 足够 大 时 ， 大 量 的 负电 荷 积聚 在 栅 极 下 层 ， 
使 得 此 区 域 从 Pp 型 反 转 为 n 型 。 这 个 反 转 区 域 称 为 沟 道 (channel) 。 此 时 就 有 了 一 个 从 n 型 源 极 
¥en 型 沟 道 到 n 型 漏 极 之 间 的 通路 ， 电 流 就 可 以 从 源 极 流 到 漏 极 ， 晶 体 管 就 处 于 导 通 状态 。 导 
通 唱 体 管 的 栅 极 电压 称 为 门限 电压 (threshold voltage) Vp, 一般 在 0.3 ~0.7V。 


源 极 Wnt W 漏 极 
栅 极 










图 1-30 nMOS 晶体 管 


pMOS 晶体 管 的 工作 方式 正好 相反 ， 这 也 可 以 从 它 的 电路 符号 上 看 出 来 。pMOS 品 体 管 的 
衬 底 电压 为 V,。， 当 栅 极 电压 为 Vv 时 ， 处 于 截止 (OFF) 状 态 ， 当 顶 极 电压 为 OV 时 ， 沟 道 反 转 
为 p FHA pMOS 处 于 导 通 状态 。 

KEHE, MOS 晶体 管 并 不 是 完美 的 开关 。 尤 其 是 ， 对 于 nMOS 晶体 管 能 很 好 地 导 通 低 电 
平 ， 但 导 通 高 电 平 的 能 力 比 较 弱 。 特 别 是 ， 当 栅 极 电压 为 fn 时 ， 漏 极 电 压 在 0 ~ Vo- Vp ZT]. 
同样 ，pMOS 晶体 管 导 通 高 电 平 的 能 力 很 好 ， 但 是 导 通 低 电 平 能 力 较 弱 。 但 是 ， 我 们 仍然 可 以 
仅仅 利用 晶体 管 较 好 的 模式 来 构造 逻辑 门 。 

nMOS 晶体 管 需要 p 型 衬 底 ， 而 pMOS 晶体 管 需 要 n 型 衬 底 。 为 了 在 同一 个 芯片 上 同时 构 
造 这 两 种 类 型 晶体 管 ， 制 造 过 程 采用 p 型 晶 元 ， 然 后 在 需要 pMOS 晶体 管 的 地 方 扩散 n 型 区 域 
构成 阱 (well ) 。 这 种 同时 提供 两 种 类 型 晶体 管 的 工艺 称 为 互补 型 MOS (complementary MOS, 
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CMOS), CMOS 工艺 已 经 成 为 当前 集成 电路 制造 的 主要 方法 。 


总 而 言 之 ，CMOS 工艺 提供 了 两 种 类 型 的 电 控 g=0 g=1 
制 开关 ， 如 图 1-31 所 示 。 栅 极 (g) 的 电压 控制 源 极 rot ae 4 
Cs) 和 漏 极 (d) 之 间 的 电流 流动 。nMOS 晶体 管 在 机 Mos sz-[ NOF fon 
极为 低 电 平时 截止 (OFF) ， 为 高 电 平时 导 通 (ON) 。 TEBE j 


pMOS 品 体 管 正好 相反 ， 在 栅 极 为 低 电 平时 导 通 


ON), OFF), s : | 
(ON) ， 为 高 电 平时 截止 (OFF ) pMos gf {ON \ OFF 
1.7.5 CMOS ZEIT] d d d 

1-32 给 出 了 用 CMOS 晶体 管 构 成 的 非 门 的 1-31 MOS 晶体 管 的 开关 模式 
电路 原理 图 ， 其 中 三 角形 表示 地 (GND)， 横 线 表 Va 
示 电 源 Yi( 这 些 标 号 在 后 续 电 路 原理 图 中 不 再 标 下 
Hi). nMOS 晶体 管 N1 连接 地 和 输出 了 上 ，pMOS 唱 十 7 
体 管 Pl 连接 电源 和 输出 Y。 两 个 晶体 管 的 栅 极 都 es 
由 输入 4 控制 。 GND 
如 果 A =0， yy N1 截止 ， Pl 导 通 ， 因此 Y 相 图 1-32” 非 门 电路 原理 图 


当 于 连接 到 电源 Vy, MSHI. HF Pl 可 以 

很 好 地 导 通 高 电 平 ， 所 以 了 可 以 被 拉 升 到 逻辑 1( 高 电 平 )。 如 果 4 =1， 则 Nl 导 通 ，P1 Buk, 
由 于 N1 可 以 很 好 导 通 低 电 平 ， 所 以 了 被 拉 至 逻辑 0。 与 图 1-12 中 的 真 值 表 比 较 ， 可 以 看 到 这 
个 电路 实现 一 个 非 门 。 


1.7.6 其 他 CMOS 逻辑 门 


图 1.33 给 出 了 两 输入 NAND 门 的 CMOS 电路 原理 图 。 在 电路 原理 图 中 ， 线 总 是 在 三 路 相 
交 的 结 点 上 连接 ， 只 有 在 有 点 的 情况 下 才 是 四 路 连 ean 

fé., nMOS 晶体 管 NI 和 N2 BK, RAB nMOS Y 
晶体 管 都 导 通 ， 输 出 才 被 拉 低 到 地 。pMOS AMA Š 

Pi 和 P2 并 联 ， 只 要 有 一 个 pMOS 晶体 管 导 通 ， 就 

可 以 将 输出 拉 升 到 Vono F 1-6 给 出 了 上 拉 网 络 和 
下 拉 网 络 的 操作 与 输出 的 状态 ， 说 明了 该 电路 完成 
与 非 功能 。 例 如 ， 当 4 =1，B=0 时 ，N1 导 通 ， 但 
N2 截止 ， 阻 塞 从 输出 了 到 地 之 间 的 通路 。P1 截止 ,但 P2 导 通 ,建立 从 电源 到 输出 了 的 通路 。 
因此 ， 输 出 了 被 上 拉 到 高 电 平 。 


图 1-33 ”两 输入 与 非 (NAND ) 门 的 
电路 原理 图 


321-6 与 非 (NAND ) 门 操作 


= = OO SC] => 
= Ọ = OIN 
© = p = jg 





图 1-34 显示 了 构造 任意 反 向 逻辑 门 (例如 ， 非 门 、 与 非 门 、 或 非 门 等 ) 的 通用 结构 。nMOS 
晶体 管 可 以 很 好 地 导 通 低 电 平 ， 因 此 下 拉 网 络 采 用 nMOS 晶体 管 连 接 输出 和 地 ， 以 便 将 输出 完 
整地 下 拉 到 低 电 平 。pMOS 晶体 管 可 以 很 好 地 导 通 高 电 平 ， 因 此 上 拉 网 络 采 用 pMOS 连接 输出 
和 电源 ， 以 便 将 输出 完整 地 上 拉 到 高 电 平 。 当 晶体 管 并 联 时 ， 只 要 有 一 个 晶体 管 导 通 ， 整 个 网 
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络 就 导 通 。 当 晶体 管 串联 时 ， 只 有 所 有 的 晶体 管 都 导 通 ， 网 络 才能 导 通 。 输 入 上 的 斜 线 表示 逮 
辑 门 可 以 有 多 个 输入 。 

如 果 上 拉 网 络 和 下 拉 网 络 同时 导 通 ， 则 会 在 电源 和 地 址 
之 间 产 生 短 路 (short circuit) 。 门 的 输出 电压 可 能 处 于 禁止 区 
域 ， 而 晶体 管 将 消耗 大 量 能 量 ， 很 可 能 会 使 其 烧毁 。 另 一 方 
面 ， 如 果 上 拉 网 络 和 下 拉 网 络 同时 截止 ， 那 么 输出 即 不 连接 
到 电源 ， 也 不 连接 到 地 ， 处 于 浮 空 状态 (float) 。 浮 空 状 态 的 
电压 是 不 确定 的 。 通 常 不 希望 有 浮 空 输出 ， 但 是 在 2.6 节 中 
可 以 看 到 ， 浮 空 也 可 以 偶尔 使 用 。 

在 具有 正常 功能 的 逻辑 门 中 ， 上 拉 或 下 拉 网 络 必然 有 一 ”图 1-34 反 向 逻辑 门 的 通用 结构 
个 导 通 且 另 一 个 截止 ， 这 样 输 出 就 可 以 被 上 拉 至 高 电 平 或 低 电 平 ， 而 不 会 产生 短路 或 浮 空 。 利 
用 传导 互补 规则 可 以 保证 这 一 点 ， 即 nMOS 采用 串联 时 ，pMOS 必须 使 用 并 联 ; nMOS 使 用 并 联 
时 ，pMOS 必须 使 用 串联 。 

三 输入 与 非 门 的 原理 图 

使 用 CMOS 晶体 管 画 一 个 三 输入 与 非 门 的 原理 图 。 

解 : 只 有 在 所 有 的 输入 都 为 1 时， 与 非 门 的 输出 才 为 0。 因 此 ， 下 拉 网 络 必须 是 3 个 串联 
的 nMOS 晶体 管 。 根 据 传 导 互 补 规则 ，pMO0OS 晶体 管 必 须 采 用 
并 联 。 电 路 原理 图 如 图 1-35 所 示 ， 读 者 可 以 自行 验证 其 功能 
是 否 与 真 值 表 吻合 。 < 

两 输入 或 非 门 的 原理 图 

使 用 CMOS 晶体 管 画 一 个 两 输入 或 非 门 。 

解 : 只 要 有 一 个 输入 为 1， 或 非 门 的 输出 就 为 0。 因 此 ， 图 1-35 三 输入 与 非 门 的 原理 图 
下 拉 网 络 应 该 由 两 个 并 联 的 nMOS 晶体 管 构 成 。 根 据 传导 互 
补 规则 ，pMOS 晶体 管 应 该 使 用 串联 方式 。 电 路 原理 图 如 
图 1-36 所 示 。 性 

两 输入 与 门 的 原理 图 7 

画 一 个 两 输入 与 门 的 原理 图 。 

解 : 不 能 用 一 个 单独 的 CMOS 门 构成 一 个 与 门 。 但 是 与 非 
门 和 非 门 却 很 容易 构造 。 因 此 ， 使 用 CMOS 构造 与 门 的 最 佳 方 四 输入 或 非 门 的 原理 图 
法 是 将 与 非 门 的 输出 连接 到 非 门 的 输入 上 ， 如 图 1-37 所 示 。 4 


1.7.7 fEAT a a Paa 
有 时 ， 设 计 者 需要 一 个 理想 的 开关 ， 它 能 同时 很 好 地 通过 图 1-37 了 两 输入 与 门 的 原理 加 
0 或 1。 注 意 nMOS 可 以 很 好 导 通 0，pMOS 可 以 很 好 地 导 通 1, 





两 者 的 组 合 就 可 以 很 好 地 导 通 两 种 电 平 。 图 1-38 给 出 了 传输 站 rei 

( transmission gate) 的 电路 符号 。 由 于 开关 是 双向 的 ， 所 以 开关 ia 

的 两 边 4 和 B 不 区 分 输入 或 输出 。 控 制 信号 称 为 使 能 (Ena- a 

ble), EN 和 EN。 当 EN=1 H EN =0 时 ,传输 门 导 通 (使 能 )， 图 1-38 传输 门 
任意 逻辑 值 可 以 在 4 和 8B 之 间 传 递 。 


1.7.8 类 nMOS 逻辑 
在 一 个 入 输入 或 非 门 中 需要 NN 个 nMOS 晶体 管 并 联 和 六 个 pMOS 唱 体 管 串联 。 正如 多 个 串 
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联 电阻 的 阻 值 大 于 并 联 的 电阻 阻 值 ， 多 个 串联 晶体 管 的 速度 也 较 慢 。 此 外 ， 由 于 pMOS 晶体 管 
的 空 穴 在 硅 唱 格 中 的 移动 速度 低 于 电子 的 速度 ， 所 以 pMOS iia 
体 管 的 速度 要 慢 于 nMOS 晶体 管 。 因 此 ， 并 联 的 多 个 nMOS ih 
体 管 的 速度 要 快 于 串联 的 多 个 pMOS 晶体 管 ， 尤 其 是 当 串 联 的 
晶体 管 数目 较 多 时 ， 速 度 差异 更 大 。 

类 nMOS 逻辑 (pseudo- nMOS logic ) 将 上 拉 网 络 中 的 pMOS 
晶体 管 替换 为 单个 始终 导 通 的 弱 pMOS 晶体 管 ， 如 图 1-39 所 
示 。 这 个 pMOS 晶体 管 经 常 称 为 弱 上 拉 (weak pull-up), HH 图 1-39 类 mnMOS 门 
尺寸 被 设计 成 满足 当 所 有 nMOS 晶体 管 都 不 导 通 时 ， 这 个 弱 上 
拉 pMOS 晶体 管 可 以 维持 输出 高 电 平 。 只 要 有 一 个 nMOS 品 体 管 





导 通 ， 就 能 超过 这 个 弱 上 拉 pMOS 晶体 管 ， 将 输出 了 下 拉 到 地 ， oils . 
产生 逻辑 0。 42 Lc LD AL 
可 以 利用 类 nMOS 逻辑 的 特点 构造 多 输入 快速 或 非 门 。 5 


图 1-40 中 给 出 了 一 个 四 输入 或 非 门 的 例子 。 类 nMOS 门 很 适合 图 1-40 类 nMOS 四 输入 非 门 
构造 存储 器 和 逻辑 阵列 (第 5 章 )。 其 缺点 是 ， 当 输出 为 低 电 平 
时 ， 弱 pMOS 晶体 管 和 所 有 的 nMOS 晶体 管 都 导 通 ， 在 电源 和 地 之 间 有 短路 。 短 路 将 持续 消耗 
能 量 ， 因 此 类 nMOS 逻辑 必须 谨慎 使 用 。 

类 nMOS 门 在 20 世纪 70 年 代 得 名 ， 当 时 的 制造 工艺 只 能 生产 nMOS 品 体 管 ， 还 不 能 制造 
pMOS 晶体 管 ， 因 此 使 用 一 个 弱 nMOS 晶体 管 来 实现 上 拉 。 


1.8 I’ 


功 耗 (power consumption ) 是 单位 时 间 内 所 消耗 的 能 量 。 在 数字 系统 中 它 非常 重要 。 在 手机 、 
笔记 本 电脑 等 移动 系统 中 ， 电 池 的 使 用 时 间 取 决 于 功 耗 。 功 耗 对 固定 电源 供电 的 系统 也 很 重 
要 ， 因 为 电力 消耗 需要 花 钱 ， 而 且 如 果 功 耗 过 高 将 导致 系统 过 热 。 

数字 系统 包含 动态 功 耗 (dynamic Power) Fil# AW FE( static Power) 。 动 态 功 耗 是 信号 在 0 和 
1 之 间 变 化 过 程 中 电容 充电 所 耗费 的 能 量 。 静 态 功 耗 是 当 信和 号 不 发 生变 化 时 ， 系 统 处 于 空闲 状 
态 下 的 功 耗 。 

逻辑 门 和 连接 它们 的 线 都 有 电容 。 将 电容 C 充电 到 电压 Voo 所 需 的 能 量 为 CVo。。 如 果 电 容 
电压 切换 的 频率 为 (每 秒 变化 /次 )， 即 在 1 秒 内 将 电容 充电 .2 次 ,放电 /2 次。 由 于 放电 过 
程 不 需要 从 电源 中 获取 能 量 ， 所 以 动态 功 耗 为 ; 


1 
ge = z Vink ( 1-4) 


电子 系统 在 空闲 时 也 需要 一 些 电流 。 当 晶体 管 处 于 截止 状态 时 ， 它 们 会 泄漏 少量 电流 。 有 
些 电路 ， 例 如 1.7. 8 节 中 讨论 的 类 nMOS 电路 ， 在 电源 和 地 之 间 始 终 有 电流 不 断 流 经 的 通路 。 
这 个 静态 电流 mp 称 为 电源 和 地 之 间 的 漏电 流 (leakage current) 或 静态 电源 电流 (quiescent supply 
current) 。 静 态 功 耗 正 比 于 漏电 流 。 

Panic = on Von (1-5) 

功 耗 

某 手机 的 电池 容量 为 6Wh( 瓦 小 时 ) ， 电 源 电压 为 1.2V。 假 设 手 机 通话 时 的 工作 频率 为 
300MHz， 芯 片 中 的 平均 电容 为 10nF ， 天 线 需 要 3W 功率 。 当 手机 不 通话 时 ， 因 为 所 有 的 信和 号 
处 理 过 程 停止 ， 所 以 动态 功 耗 降低 到 0。 但 是 手机 无 论 是 否 工作 仍然 具有 40mA 的 漏电 流 。 请 
确定 不 通话 情况 和 连续 通话 情况 下 ， 电 池 的 使 用 时 间 。 
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fh: 静态 功 耗 P = (0.040A) (1.2V) =48mW。(a) 如 果 手 机 不 通话 ， 因 为 仅 有 静态 功 
耗 ， 所 以 其 电池 使 用 时 间 为 (6Wh)/(0.048W) =125h( 约 5 天 )。(b) 如 果 手 机 通话 ， 其 动态 功 
耗 为 P .=(0.5)(10…F)(1.2V) (3 x10 Hz) =2. 16W, 加 上 项 态 功 耗 和 天 线 功 耗 ， 总 的 通 
话 功 耗 为 2.16W +3W +0. 048W =5.2W。 因 此 电池 使 用 时 间 为 6Wh/5.2W = 1. 153h。 这 个 例子 
对 手机 的 实际 操作 进行 了 简化 ， 但 是 可 以 说 明 功 耗 的 关键 性 问题 。 < 


1.9 总 结 和 展望 

世界 上 有 10 种 类 型 的 人 ? 其 中 哪些 人 可 以 用 二 进 制 计数 ,哪些 不 能 ? 

本 章 介 绍 了 理解 和 设计 复杂 系统 的 基本 原则 。 虽 然 真 实 世 界 是 模拟 世界 ， 但 数字 电路 设计 
人 员 对 这 些 模拟 值 进行 约束 ， 只 使 用 可 能 信号 中 的 离散 子 集 。 特 别 地 ， 二 进 制 变 量 只 有 两 个 状 
AS: 0 和 1， 也 称 为 FALSE 和 TRUE， 或 者 LOW 和 HICH。 逻 辑 门 根据 一 个 或 多 个 二 进 制 输入 
计算 一 位 二 进 制 输出 。 常 见 的 逻辑 门 包括 : 

e NOT: 当 输 入 为 FLASE 时 ， 输 出 TRUE。 

。 AND: 当 所 有 输入 都 为 TRUE 时 ， 输 出 TRUE, 

。 OR: 只 要 有 一 个 输入 为 TRUE 时 ， 输 出 TRUE; 

。 XOR: 奇数 个 输入 为 TRUE 时 ， 输 出 TRUE。 

逻辑 门 常用 CMOS 晶体 管 构成 。CMOS 的 行为 类 似 于 电子 控制 开关 。nMOS 在 栅 极 为 1 时 
iH, pMOS 在 栅 极 为 0 时 导 通 。 

在 第 2 ~5 章 中 ， 我 们 将 继续 研究 数字 逻辑 。 第 2 章 着 重 研究 输出 仅仅 依赖 于 当前 输入 的 
$8 @-3% $ (combinational logic) 。 前 面 介绍 的 逻辑 门 都 是 组 合 逻 辑 的 实例 。 在 第 2 章 中 将 学 习 使 
用 多 个 门 来 设计 电路 ， 以 便 实 现 真 值 表 或 布尔 表达 式 描述 的 输入 与 输出 之 间 的 关系 。 第 3 章 着 
重 研究 时 序 远 辑 (sequential logic) ， 其 输出 依赖 于 当前 的 输入 和 过 去 的 输入 。 作 为 基本 的 时 序 
元 件 ， 雪 存 器 (register) 可 以 记 住 它们 以 前 的 输入 。 基 于 寄存 器 和 组 合 逻辑 构成 的 有 限 状 态 机 
(finite state machine) 提供 了 一 种 强 有 力 的 系统 化 方法 来 构造 复杂 系统 。 我 们 还 将 研究 数字 系统 
的 时 序 来 分 析 系 统 如 何 快速 运行 。 第 4 章 介绍 硬件 描述 语言 (HDL) 。 硬 件 描述 语言 与 传统 的 程 
序 设计 语言 相关 ， 但 是 它们 用 于 模拟 和 构造 硬件 系统 而 不 是 软件 。 现 代 的 大 多 数 数字 系统 都 使 
用 硬件 摘 述 语言 来 设计 。SystemVerilog 和 VHDL 是 两 种 流行 的 硬件 描述 语言 。 它 们 在 本 书 中 一 
起 介绍 。 第 5 章 研 究 其 他 组 合 逻 辑 和 时 序 逻 辑 模块 ， 如 加 法 器 、 乘 法 器 和 存储 器 等 。 

第 6 章 将 转移 到 计算 机 体系 结构 。 此 章 介绍 MIPS 处 理 器 ， 一 种 行业 标准 微 处 理 器 。 该 处 
理 融 可 以 用 于 消费 类 电子 产品 ，SGI 工作 站 ,电视 、 网 络 硬件 和 无 线 链 路 等 通信 系统 中 。MIPS 
体系 结构 由 寄存 器 和 汇编 语言 指令 集 定 义 。 此 章 中 将 学 习 如 何 用 汇编 语言 为 MIPS 处 理 器 书写 
程序 ， 这 样 就 可 以 用 处 理 器 自身 的 语言 和 它们 通信 了 。 

第 7 章 和 第 8 章 填 补 了 数字 逻辑 与 计算 机 体系 结构 之 间 的 空 除 。 第 7 章 研 究 微 结 构 ， 即 如 
何 将 加 法 器 、 寄 存 器 等 数字 模块 组 合 在 一 起 来 构成 微 处 理 器 。 在 此 章 中 ， 可 以 学 习 如 何 构造 自 
CLAY MIPS Abiko KRE, MUAY 3 种 不 同 的 微 结构 ， 它 们 用 来 说 明 在 性 能 和 成 本 之 间 的 
不 同 折 中 。 处 理 器 性 能 按 指数 方式 增长 ， 需 要 更 复杂 的 存储 器 系统 来 满足 处 理 器 不 断 提 出 的 数 
据 需 求 。 第 8 章 深入 人 研究 存储 器 系统 体系 结构 ， 同 时 还 介绍 了 计算 机 与 键盘 、 打 印 机 等 外 部 设 
备 进行 通信 的 方法 。 


习题 


1.1 用 一 张 图 解释 以 下 领域 中 出 现 的 至 少 3 个 层次 的 抽象 ， 
a) 生物 学 家 研究 细胞 的 操作 。 
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b) 化 学 家 研究 物质 的 构成 。 

用 一 张 图 解释 以 下 领域 中 使 用 的 层次 化 、 模 块 化 和 规整 化 技术 ， 

a) 汽车 设计 工程 师 。 

b) 管理 业务 的 商人 。 

Ben 正在 盖 房 子 。 解 释 在 建 房 过 程 中 他 如 何 应 用 层次 化 、 模 块 化 和 规整 化 原则 来 节省 时 
间 和 金钱 。 

一 个 模拟 信号 的 范围 为 0 ~5V。 如 果 测 量 的 精度 为 +50mV， 此 模拟 信号 最 多 可 以 传递 多 
少 位 的 信息 ? 

教室 中 ， 旧 钟 的 分 钟 指 针 已 经 折断 。 

a) 如 果 你 可 以 读 取 时 钟 指针 接近 于 15 分 钟 ， 那 么 时 钟 传递 了 多 少 位 的 时 间 信 息 ? 

b) 如 果 你 知道 现在 是 否 临 近 中 午 ， 则 可 以 再 多 获得 多 少 位 关于 时 间 的 附加 信息 ? 
巴比伦 人 在 4000 年 前 提出 了 基 为 60 的 60 进 制 数 制 系统 。 一 个 60 进 制 的 数字 可 以 传递 
多 少 位 信息 ? 你 应 该 如 何 用 60 进 制 写 4000 这 个 数字 ? 

16 位 可 以 表示 多 少 个 不 同 的 数 ? 

最 大 的 无 符号 32 位 二 进 制 数 是 多 少 ? 


对 于 以 下 3 种 数 制 系统 ， 最 大 的 16 位 二 进 制 数 是 多 少 ? 

a) 无 符号 数 b) 二 进 制 补 码 数 c) 带 符号 的 原 码 数 
对 于 以 下 3 种 数 制 系统 ， 最 大 的 32 位 二 进 制 数 是 多 少 ? 

a) 无 符号 数 b) 二 进 制 补 码 数 c) 带 符号 的 原 码 数 
对 于 以 下 3 种 数 制 系统 ， 最 小 的 16 位 二 进 制 数 是 多 少 ? 

a) 无 符号 数 b) 二 进 制 补 码 数 c) 带 符号 的 原 码 数 
对 于 以 下 3 种 数 制 系统 ， 最 小 的 32 位 二 进 制 数 是 多 少 ? 

a) 无 符号 数 b) 二 进 制 补 码 数 c) 带 符号 的 原 码 数 
将 下 列 无 符号 二 进 制 数 转化 为 十 进 制 。 

a) 1010, b) 110110, c) 11110000, d) 0001100010100111, 
将 下 列 无 符号 二 进 制 数 转化 为 十 进 制 。 

a} MIO E b) 100100, c) 11010111, d) 011101010100100, 
重复 习题 1. 13 ， 但 要 求 转 换 为 十 六 进 制 。 

重复 习题 1. 14 ， 但 要 求 转换 为 十 六 进 制 。 

将 下 列 十 六 进 制 数 转换 为 十 进 制 

a) A5 b) 3B, c) FFFF d) DO000000,, 
将 下 列 十 六 进 制 数 转换 为 十 进 制 

a) 4E,, b) 7C,, c) ED3A,, d) 403FBO001,, 
重复 习题 1. 17， 但 要 求 转换 为 无 符号 二 进 制 数 。 

重复 习题 1. 18 ， 但 要 求 转换 为 无 符号 二 进 制 数 。 

将 下 列 二 进 制 补 码 数 转 换 为 十 进 制 。 

a) 1010, b) 110110, c) 01110000, d) 10011111, 
将 下 列 二 进 制 补 码 数 转换 为 十 进 制 。 

a) 1110, b) 100011, c) 01001110, d) 10110101, 
重复 习题 1.21, 但 是 这 些 二 进 制 数 采用 带 符号 的 原 码 数 。 

重复 习题 1. 22 ， 但 是 这 些 二 进 制 数 采 用 带 符号 的 原 码 数 。 


将 下 列 十 进 制 数 转 换 为 无 符号 二 进 制 。 
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a) 42 ， b) 63 ， c) 229 ， d) 845 ， 
将 下 列 十 进 制 数 转换 为 无 符号 二 进 制 。 
a) 14 b) 52, c) 339, d) 711 


重复 习题 1. 25 ， 但 是 要 求 转换 为 十 六 进 制 。 
重复 习题 1.26， 但 是 要 求 转换 为 十 六 进 制 。 
将 下 述 十 进 制 数 转 为 8 位 二 进 制 补 码 ， 并 指出 哪些 十 进 制 数 超出 了 相应 的 表示 范围 。 


a) 42,, b) -63,, c) 124,, d) -128 

e) 133,, 

将 下 述 十 进 制 数 转 为 8 位 二 进 制 补 码 ， 并 指出 哪些 十 进 制 数 超出 了 相应 的 表示 范围 。 
a) 24,, b) -59,, c) 128, d) -150 

e) 127,, 


重复 习题 1. 29， 但 是 转换 为 8 位 带 符号 的 原 码 数 。 

重复 习题 1. 30, 但 是 转换 为 8 位 带 符号 的 原 码 数 。 

将 下 列 4 位 二 进 制 补 码 数 转换 为 8 位 二 进 制 补 码 。 

a) 0101, b) 1010, 

将 下 列 4 位 二 进 制 补 码 数 转换 为 8 位 二 进 制 补 码 。 

a) 0111, b) 1001, 

重复 习题 1. 33 ， 但 二 进 制 数 为 无 符号 二 进 制 数 。 

重复 习题 1. 34, 但 二 进 制 数 为 无 符号 二 进 制 数 。 

基 为 8 的 数 制 称 为 八进制 数 (octal)。 将 习题 1. 25 中 的 数 转换 为 八进制 数 。 
基 为 8 的 数 制 称 为 八进制 数 (octal) 。 将 习题 1. 26 中 的 数 转换 为 八进制 数 。 
将 下 述 八 进 制 数 转换 为 二 进 制 、 十 六 进 制 和 十 进 制 。 


a) 42, b) 63, c) 255, d) 3047, 
将 下 述 八 进 制 数 转换 为 二 进 制 、 十 六 进 制 和 十 进 制 。 
a) 23, b) 45, c) 371, d) 2560, 


有 多 少 个 5 位 三 进 制 补 码 数 大 于 0? 有 多 少 个 小 于 0 WE? 这 个 结果 与 带 符号 的 原 码 数 有 
区 别 吗 ? 

有 多 少 个 7 位 二 进 制 补 码 数 大 于 0? 有 多 少 小 于 0 WE? 这 个 结果 与 带 符号 的 原 码 数 有 区 
别 吗 ? 

在 一 个 32 位 字 中 有 多 少 个 字 节 ? 多 少 个 半 字 证 ? 

在 一 个 64 位 字 中 有 多 少 个 字 节 ? 

某 DSL 调制 解 调 器 的 数据 传输 率 为 768Kbps。 它 1 分 钟 内 可 以 接收 多 少 字 节 ? 

USB 3. 0 的 数据 传输 率 为 5Gbps。 它 1 分 钟 可 以 发 送 多 少 字 广 ? 

硬盘 制造 商 使 用 MB 字 节 表示 10' 字 节 ， 使 用 GB 表示 10 字 节 。 在 一 个 50GB 字 节 的 便 
盘 上 真正 能 用 于 存储 音乐 的 空间 有 多 大 ? 

不 用 计算 器 估计 2 有 多 大 ? be 
Pentium I 计算 机 上 的 存储 器 按照 位 阵列 的 方式 组 织 。 其 中 有 2 行 和 2 列 。 不 用 计算 天 
估计 器 存储 容量 有 多 少 位 ? 

针对 3 位 无 符号 数 、 二 进 制 补 码 和 带 符 号 的 原 码 数 画 出 类 似 于 图 1-11 的 图 。 

针对 2 位 无 符号 数 、 二 进 制 补 码 和 带 符号 的 原 码 数 画 出 类 似 于 图 1-11 的 图 。 

对 下 列 无 符号 二 进 制 数 进行 加 法 。 指 出 在 结果 为 4 位 情况 下 ， 和 是 和 否 会 溢出 。 

a) 1001, +0100, b) 1101, +1011, 
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对 下 列 无 符号 二 进 制 数 进行 加 法 。 指 出 在 结果 为 8 位 情况 下 ， 和 是 否 会 溢出 。 

a) 10011001, +01000100, b) 11010010, + 10110110, 

重复 习题 1. 52， 并 假设 二 进 制 数 采 用 二 进 制 补 码 表示 。 

重复 习题 1. 53， 并 假设 二 进 制 数 采用 二 进 制 补 码 表 示 。 

将 下 列 十 进 制 数 转换 为 6 位 二 进 制 补 码 表示 ， 并 完成 加 法 操作 。 指 出 对 于 6 位 结果 是 否 
产生 溢出 。 


a) 16o +91 b) 27.9 +31 c) -4,, +19,, d) 3 + -320 

e) -16o + -9o f) -27,, + -31o 

对 下 列 数字 重复 习题 1. 56。 

a) 719 +1315 b)17,, +25, c) -—26,, +8, d) 31,, + -140 

e) -19,, + -22o f) -2o + -290 

对 下 列 无 符号 十 六 进 制 数 进行 加 法 操作 。 指 出 对 于 8 位 结果 是 否 产生 溢出 。 

a) Tig +916 b) 13,, +28, c) AB +3E,, d) 8F + AD,, 
对 下 列 无 符号 十 六 进 制 数 进行 加 法 操作 。 指 出 对 于 8 位 结果 是 否 产生 溢出 。 

a) 22,, +81. DY 73, +2C,, c) TF i+ TF e d) C2 + A4.. 


将 下 列 十 进 制 数 转换 为 5 位 二 进 制 补 码 ， 并 进行 减法 运算 。 指 出 对 于 5 位 结果 是 否 产生 
Yat HH o 

a) 919 -— 71 b) 12,, -15,, c) -6o —11,, d) 41, -=S 

将 下 列 十 进 制 数 转换 为 5 位 二 进 制 补 码 ， 并 进行 减法 运算 。 指 出 对 于 5 位 结果 是 否 产生 
Yat HH o 

a) 18,, -12,, b) 3015 -9o c) 一 28 -3o d) -16 -21o 

在 偏 置 的 (biased) N 位 二 进 制 数 制 中 ， 对 于 偏 置 量 8B， 正 数 或 负数 表示 为 其 值 加 上 Bo 
例如 ， 在 偏 置 量 为 15 的 5 位 二 进 制 中 ，0 表示 为 01111 ，1 表示 为 10000 ， 等 等 。 偏 置 数 
制 可 以 用 于 浮 点 算术 中 ， 详 细 内 容 在 第 5 章 中 讨论 。 考 虑 一 个 偏 置 量 为 127o 的 偏 置 的 8 
位 二 进 制 。 

a) 二 进 制 数 10000010, 对 应 的 十 进 制 数 为 多 少 ? 

b) 表示 0 的 二 进 制 数 是 多 少 ? 

c) 最 小 负数 的 值 是 多 少 ? 二 进 制 表示 是 什么 ? 

d) 最 大 正 数 的 值 是 多 少 ? 二 进 制 表示 是 什么 ? 

针对 偏 置 量 为 3 的 3 位 偏 置 数 制 ， 画 出 类 似 图 1-11 的 数 线 (参见 习题 1. 62 中 对 偏 置 数 
制 的 定义 ) 。 
在 二 进 制 编码 的 十 进 制 (Binary Coded Decimal, ，BCD) 系 统 中 ,用 4 位 二 进 制 数 表示 从 
0 ~9 的 十 进 制 数 。 例 如 ，37 ,表示 位 00110111 ，。 

a) 写 出 2891, 的 BCD 码 表示 。 

b) 将 1001010100015cs 转 换 为 十 进 制 数 。 

c) 将 01101001sco 转 换 为 二 进 制 数 。 

d) 解释 为 什么 BCD 码 也 是 一 种 常用 的 数字 表示 方法 。 

回答 下 列 与 BCD 系统 相关 的 问题 (BCD 系统 的 定义 请 看 习题 1. 64) 。 

a) 写 出 371,。 的 BCD 码 表示 。 

b) 将 000110000111sco 转 换 为 十 进 制 数 。 

c) 将 10010101scw 转 换 为 二 进 制 数 。 

d) 说 明 BCD 码 与 二 进 制 数 字 表 示 方 法 相 比 较 的 劣势 。 
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一 个 飞碟 坠毁 在 Nebraska 的 庄稼 地 里 。 联 邦 调查 局 检查 了 飞碟 残骸 ， 并 在 一 个 工程 手 
册 中 发 现 了 按照 Martin 数 制 写 的 等 式 ，325 +42 =411。 如 果 等 式 是 正确 的 ，Martin 数 制 
的 基数 是 多 少 ? 

Ben 和 Alyssa 正在 争论 一 个 问题 。Ben 说 :“ 所 有 大 于 0 且 能 被 6 整除 的 正 数 的 二 进 制 表 
示 中 必然 只 有 两 个 1”。Alyssa 不 同意 。 她 说 : “不 是 这 样 ， 所 有 这 些 数 的 二 进 制 表示 中 
有 奇数 个 1”。 你 同意 Ben 还 是 Alyssa， 或 者 都 不 同意 ? 解释 你 的 理由 。 

Ben 和 Alyssa 又 争论 另 一 个 问题 。Ben 说 :“ 我 可 以 通过 将 一 个 数 减 1， 然 后 将 结果 的 各 
位 取 反 来 得 到 这 个 数 的 二 进 制 补 码 ”。 Alyssa 说 :“ 不 ， 我 可 以 从 一 个 数 的 最 低位 开始 检 
查 每 一 位 ， 从 发 现 的 第 一 个 1 开始， 将 后 续 的 所 有 位 取 反 来 获得 这 个 数 的 二 进 制 补 码 ”。 
你 同意 Ben 还 是 Alyssa， 或 都 同意 或 都 不 同意 ?” 解释 你 的 理由 。 

以 你 喜欢 的 语言 (C、Java、Penl ) 写 一 个 程序 ， 将 二 进 制 转换 为 十 进 制 。 用 户 应 输入 无 
符号 二 进 制 数 ， 程 序 输出 十 进 制 值 。 

重复 习题 1.69, 但 是 将 任意 基数 b, 的 数 转换 为 男 一 个 基数 b, 的 数 。 支 持 的 最 大 基数 为 
16 ， 使 用 字母 表示 大 于 9 的 数 。 用 户 输入 b, 和 4b,， 然 后 输入 基数 为 6 的 数 。 程 序 输 出 基 
数 为 b, 的 数 。 

针对 下 述 逻 辑 门 ， 给 出 其 电路 符号 、 布 尔 表达 式 和 真 值 表 。 


a) 三 输入 或 门 b) 三 输入 异 或 门 c) 四 输入 异 或 非 门 
针对 下 述 逻 辑 门 ， 给 出 其 电路 符号 、 布 尔 表 达 式 和 真 值 表 。 
a) 四 输入 或 门 b) 三 输入 异 或 非 门 c) 五 输入 与 非 门 


多 数 门 电路 在 多 于 一 半 的 输入 为 TRUE 时 输出 TRUE。 请 给 出 图 1-41 所 示 的 三 输入 多 数 
门 的 真 值 表 。 

如 图 1-42 所 示 的 三 输入 AND-OR(AO ) 门 将 在 4 和 了 都 为 TRUE， 或 者 C 为 TRUE 时 ， 
输出 TRUE。 请 给 出 其 真 值 表 。 

如 图 1-43 所 示 的 三 输入 OR-AND-INVERT( OAL) 门将 在 C 为 TRUE， 且 4 或 有 为 TRUE 
时 ， 输 出 FALSE。 其 余 情况 将 产生 TRUE。 请 给 出 其 真 值 表 。 


s Ma 
B-MAJ-Y B B 
C C Y C Y 


图 1-41 三 输入 多 数 门 ” 图 1-42 三 输入 AND-OR 门 图 1-43 三 输入 OR-AND-INVERT [J 
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对 于 两 个 输入 变量 ， 请 列 出 所 有 不 同 的 16 种 不 同 的 真 值 表 。 对 于 每 种 真 值 表 ， 请 给 一 
个 简短 的 名 字 ( 例 如 ，OR、NAND 等 ) 。 

对 于 N 个 输入 变量 ， 有 多 少 种 不 同 的 真 值 表 ? 

如 果 某 器 件 的 直流 传输 特性 如 图 1-44 所 示 ， 该 器 件 Vo 

是 否 可 以 作为 反 相 器 使 用 ? 如 果 可 以 ， 其 输入 和 输出 
IREBE (Vo. Vous Vay Al TV) 以 及 噪声 容 限 (NM 
和 NM ) 分 别 是 多 少 ?如 果 不 能 用 作 反 相 器 ， 请 说 明 4 
理由 。 3 
对 图 1-45 所 述 部 件 重复 习题 1.78。 l 
如 果 某 器 件 的 直流 传输 特性 如 图 1-46 所 示 ， 该 器 件 
是 否 可 以 作为 缓冲 器 使 用 ? 如 果 可 以 ， 其 输入 和 输出 
的 高 低 电 平 (所 Vos Von Al Ti) 以 及 噪声 容 限 (NM O TO a 
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图 1-45 直流 传输 特性 图 1-46 直流 传输 特性 


Ben 发 明了 一 个 缓冲 器 电路 ， 其 直流 传输 特性 如 图 


ou 

1-47 所 示 ， 这 个 缓冲 器 能 正常 工作 吗 ? 请 解释 原因 。 33 

Ben 希望 宣称 这 个 电路 与 LVCMOS 和 LVTTL 逻辑 兼 30 

容 。Ben 的 这 个 缓冲 器 是 否 可 以 正确 接收 这 些 逻 辑 24 

系列 的 输入 ? 其 输出 是 否 可 以 正确 驱动 这 些 逻 辑 系 18 

列 ? 请 解释 原因 。 

Ben 在 黑暗 的 小 埠 中 磁 到 了 一 个 两 输入 门 ， 其 传输 ，， 

功能 如 图 1-48 所 示 。 其 中 4、 为 输入 ，Y 为 输出 。 

a) 他 发 现 的 逻辑 门 是 哪 种 类 型 ? 0 ne 


b) 其 大 约 的 高 低 逻辑 电 平 是 多 少 ? 0 06 12 18 24 3.033 
对 图 1-49 重复 习题 1. 82, 图 1-47 Ben 的 缓冲 器 直流 传输 特性 





图 1-48 ”两 输入 直流 传输 特性 图 1-49 两 输入 直流 传输 特性 
用 最 少 的 晶体 管 画 出 下 述 CMOS 逻辑 门 的 晶体 管 级 电路 。 
a) 四 输入 NAND 门 
b) 三 输入 OR-AND-INVERT 门 (参见 习题 1.75) 
c) 三 输入 AND-OR 门 (参见 习题 1.74) 
用 最 少 的 晶体 管 画 出 下 述 CMOS 逻辑 门 的 晶体 管 级 电路 。 
a) 三 输入 NOR 门 b) 三 输入 AND 门 c) 二 输入 OR 门 
少数 门 (miuority gate) 在 少 于 一 半 的 输入 为 TRUE 时 ， 输 出 TRUE ， 和 否则 将 产生 FALSE, 
请 用 最 少 的 晶体 管 画 出 三 输入 CMOS 少数 门 电路 的 晶体 管 级 电路 。 
请 给 出 图 1-50 所 示 逻 辑 门 的 真 值 表 。 真 值 表 的 输入 为 4 和 B。 请 说 明 此 逻辑 功能 的 
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名 称 。 

请 给 出 图 1-51 所 示 逻 辑 门 的 真 值 表 。 真 值 表 的 输入 为 4、 中 和 C。 
AA Ai 
A, er 
a 4 t eA 
sE s y 

K 1-50 PRAH E RE 图 1-51 待 求解 的 电路 原理 图 


仅 使 用 类 nMOS 逻辑 门 实现 下 述 三 输入 逻辑 门 。 该 逻辑 门 的 输入 为 4、B 和 CC。 使 用 最 
少 的 晶体 管 。 

a) 三 输入 NOR 门 b) 三 输入 NAND 门 c) 三 输入 AND 门 

电阻 晶体 管 远 辑 (Resistor-Transistor Logic，RTL) 使 用 nMOS 


晶体 管 将 输出 下 拉 到 LOW， 在 没有 回路 连接 到 地 时 使 用 弱 i N 

电阻 将 输出 上 拉 到 HIGH。 使 用 RTL 构成 的 非 门 如 图 1-52 A 

所 示 。 画 出 用 RTL 构成 的 三 输入 NOR 门 。 使 用 最 少数 目的 

晶体 管 。 图 1-52 ”RTL 构成 的 非 门 
面试 问题 


下 述 问 题 在 数字 电路 设计 工作 的 面试 中 曾经 被 问 到 。 


1.1 
Ke 


1.3 


请 画 出 CMOS 四 输入 NOR 门 的 晶体 管 级 电路 。 

国王 收 到 了 64 个 金币 ， 但 是 其 中 有 一 个 是 假 的 。 他 命令 你 找 出 这 个 假币 。 如 果 你 有 一 个 
天 平 ， 请 问 需要 多 少 次 才能 找到 那个 比较 轻 的 假币 ? 

一 个 教授 、 一 个 助教 、 一 个 数字 设计 专业 的 学 生 和 一 个 新 生 需 要 在 黑夜 里 经 过 一 座 摇 摇 
晃 晃 的 桥 。 这 座 桥 很 不 稳固 ， 每 次 只 能 有 两 个 人 通过 。 他 们 只 有 一 把 火炬 ， 而且 桥 的 跨 
度 太 大 无 法 把 火炬 扔 回来 ， 因 此 必须 有 人 要 把 火炬 拿 回 来 。 新 生 过 桥 需要 1 分 钟 ， 数 字 
设计 专业 的 学 生 过 桥 需 要 2 分 钟 ， 助 教 过 桥 需 要 5 分 钟 ， 教 授 过 桥 需要 10 分 钟 。 所 有 人 
都 通过 此 桥 的 最 短 时 间 是 多 少 ? 
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在 数字 电路 中 ， 电 路 是 一 个 可 以 处 理 离 散 值 变量 的 网 络 。 
一 个 电路 可 以 看 作 一 个 黑 盒子 ， 如 图 2-1 所 示 ， 其 中 包括 : 
。 一 个 或 者 多 个 离散 值 输入 端 (input terminal ) 。 
。 一 个 或 者 多 个 离散 值 输出 端 (output terminal) 。 
e 描述 输入 和 输出 关系 的 功能 规范 (function specifica- 
tion) 。 
o 描述 当 输 入 改变 时 输出 啊 应 延迟 的 时 序 规范 (timing speci- 


fication ) 。 


功能 规范 
输入 输出 
时 序 规范 
图 2-1 将 电路 作为 具有 输入 、 输 出 和 规范 的 串 盒 子 


宽 视 黑 盒 子 的 内 部 ， 电 路 由 结 点 和 元 件 组 成 。 元 件 ( ele- 
ment) 本身 又 是 一 个 带 有 输入 、 输 出 、 功 能 规范 和 时 序 规范 的 
电路 。 结 点 (node) 是 一 段 导 线 ， 它 通过 电压 传递 离散 值 变 量 。 
结 点 可 分 为 输入 结 点 、 输 出 结 点 或 内 部 结 点 。 输 入 结 点 接收 外 
部 世界 的 值 ， 输 出 结 点 输出 值 到 外 部 世界 。 既 不 是 输入 结 点 也 
不 是 输出 结 点 的 线 称 为 内 部 结 点 。 图 2-2 显示 了 一 个 带 有 3 个 
元 件 和 6 个 结 点 的 电路 ，EL、E2 和 E3 是 3 个 元 件 , A B,C 
是 输入 结 点 ， 了 和 了 是 输出 结 点 ，nl 是 El 和 E2 之 间 的 内 部 
结 点 。 

数字 电路 可 以 分 为 组 合 电 路 (combinational circuit) 和 时 序 
电路 ( sequential circuit)。 组 合 电 路 的 输出 仅仅 取决 于 输入 的 
值 。 换 句 话 说 ， 它 组 合 当前 输入 值 来 确定 输出 值 。 例 如 ， 逻 
辑 门 是 组 合 电 路 。 时 序 电 路 的 输出 取决 于 当前 输入 值 和 之 前 
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图 2-2 元 件 和 结 点 


的 输入 值 。 换 句 话 说 ， 它 取决 于 输入 的 序列 。 组 合 电路 是 没有 记忆 的 ,但 是 时 序 电 路 是 有 记忆 


的 。 本 章 重点 放 在 组 合 电 路 ， 第 3 章 考 察 时 序 电 路 。 


组 合 电路 的 功能 规范 表示 当前 各 种 输入 值 的 输出 值 。 组 合 电 路 的 时 序 规范 包括 从 输入 到 输 
出 延迟 的 最 大 值 和 最 小 值 。 在 本 章 中 ， 我 们 首先 重点 介绍 功能 规范 ， 在 后 面部 分 再 回 过 来 学 习 


时 序 规范 。 

如 图 2-3 所 示 ， 一 个 组 合 电路 有 2 个 输入 和 1 个 输出 。 在 
图 的 左边 是 输入 结 点 4 和 路， 在 图 的 右边 是 输出 结 点 Y 盒子 
里 面 的 和 符号 表示 它 只 能 使 用 组 合 逻辑 实现 。 在 这 个 例子 中 ， 
功能 下 指定 为 或 (OR) 逻 辑 ，7Y= (4，B) =A+B, 简单 地 说 ， 
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输出 了 Y 是 2 个 输入 4 AB 的 函数 ， 即 Y=A OR B, 

图 2-4 给 出 了 图 2-3 中 组 合 逻 辑 电 路 的 两 种 可 能 实现 (implemen- 
tation) 。 在 本 书 中 ,我们 将 多 次 看 到 ， 一 个 简单 函数 通常 有 多 种 实 
现 。 可 以 根据 配置 和 设计 约束 选择 给 定 的 模块 来 实现 组 合 电 路 。 这 
些 约束 通常 包括 面积 、 速 度 、 功 率 和 设计 时 间 。 

图 2-5 是 一 个 有 多 个 输出 的 组 合 电 路 。 这 个 特殊 的 组 合 电 路 称 
为 全 加 器 (full adder) ， 我 们 将 在 5.2.1 节 中 再 次 学 习 它 。 图 中 的 两 
个 等 式 说 明 根 据 输入 A、B 和 Ci 来 确定 输出 S 和 C。 的 函数 。 

为 了 简化 画图 ， 我 们 经 常用 一 根 信 号 线 表示 由 多 个 信号 构成 的 
总 线 (bus) ， 总 线 上 有 一 根 斜 线 ， 并 在 旁边 标注 一 个 数字 ， 数 字 表 示 
总 线 上 的 信号 数量 。 例 如 ， 图 2-6a 表示 组 合 逻 辑 块 有 3 个 输入 和 2 
个 输出 。 如 果 总 线 的 位 数 不 重 要 或 者 在 上 下 文中 很 明显 时 ， 斜 线 旁 
可 以 不 标识 数字 。 在 图 2-6b 中 ， 两 个 组 合 逻 辑 块 有 任意 数量 的 输出 ， 

一 个 逻辑 块 的 输出 作为 下 一 个 逻辑 块 的 输入 。 

组 合 电路 的 构成 规则 告诉 我 们 如 何 通过 较 小 的 组 合 电 路 元 件 构 
造 一 个 大 的 组 合 电 路 。 如 果 一 个 电路 由 相互 连接 的 电路 元 件 构成 ， 
则 在 满足 以 下 条 件 时 ， 它 就 是 组 合 电路 。 

。 每 一 个 电路 元 件 本 身 都 是 组 合 电路 。 

。 每 一 个 电路 结 点 或 者 是 一 个 电路 的 输入 ， 或 者 是 连接 到 外 部 

电路 的 一 个 输出 端 。 

。 电路 不 包含 回路 : 经 过 电路 的 每 条 路 径 最 多 只 能 经 过 每 个 电 

路 结 点 一 次 。 


组 合 电路 


a) 
1] eer 
b) 
图 2-4 ak(OR) PRN 
种 实现 
A 
S 
EDs 


S=ADBOC, 
Con = AB + AC,, + BC,, 


图 2-5 多 输出 组 合 逻 辑 


ae 
a) 
b) 


图 2-6 斜 线 表示 多 个 信号 


根据 组 合 电路 的 构成 规则 ， 在 图 2-7 所 示 的 电路 中 ， 哪 些 是 组 合 电路 ? 


he 


pe De Be 


2-7 示例 电路 


解 : 电路 (a) 是 组 合 电 路 。 它 由 2 个 组 合 电路 元 件 构 成 ( 道 变 器 了 和 了 且 )。 它 有 3 个 结 点 : 
nl 、n2 和 n3。nl ERRA I 的 输入 ; RAB, BU 的 输出 和 也 的 输入 ; n3 是 电路 和 
2 的 输出 。(b) 不 是 组 合 电路 ， 因 为 它 存 在 回路 : 异 或 (XOR) 门 的 输出 反馈 到 一 个 输入 端 。 因 
此 ， 从 n4 开始 通过 XOR 门 到 n5 再 返回 到 n4 是 一 个 回路 。(e) 是 组 合 电路 。(d) 不 是 组 合 电 
路 ， 因 为 结 点 n6 同时 连接 B 和 了 4 的 输出 端 。(e) 是 组 合 电 路 ， 它 表示 两 个 组 合 电 路 连接 而 构 
成 一 个 大 的 组 合 电 路 。(f) 没 有 遵守 组 合 电 路 的 构成 规则 ， 因 为 它 有 一 个 回路 通过 2 个 元 件 。 


它 是 否 为 组 合 电 路 需要 视 元 件 的 功能 而 定 。 


< 


像 微 处 理 器 这 样 的 大 规模 电路 非常 复杂 ， 所 以 可 以 用 第 1 章 介绍 的 原理 来 控制 复杂 性 。 可 
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以 应 用 抽象 和 模块 化 原则 将 电路 视 为 一 个 明确 定义 了 接口 和 功能 的 黑匣子 。 可 以 应 用 层次 化 原 [57] 
则 由 较 小 的 电路 元 件 构建 复杂 电路 。 组 合 电路 的 构成 规则 应 用 了 约束 原理 。 
组 合 电路 的 功能 规范 通常 描述 为 真 值 表 或 者 布尔 表达 式 。 在 后 续 的 章节 中 ， 我 们 将 介绍 如 
何 通过 真 值 表 得 到 布尔 表达 式 ， 如 何 使 用 布尔 代数 和 卡 诺 图 来 化 简 表 达 式 ， 说 明 如 何 通过 逻辑 
门 来 实现 这 些 表达 式 并 说 明 如 何 分 析 这 些 电路 的 速度 。 


2.2 布尔 表达 式 
布尔 表达 式 ( Boolean equation) 处 理 变量 是 TRUE 或 FALSE， 所 以 它们 很 适合 描述 数字 软 


辑 。 本 节 定 义 一 些 布尔 表达 式 中 常用 的 术语 ， 然 后 介绍 如 何 为 给 定 真 值 表 的 逻辑 函数 写 出 布尔 
表达 式 。 


2.2.1 术语 


一 个 变量 4 hJa (complement) 是 它 的 反 ， 记 为 4。 变 量 或 它 的 反 称 为 项 (literal) 。 比 如 ，4、 
A、B 和 B 是 项 。 我 们 称 4 为 变量 的 真 值 形式 (true form) ，4 为 取 反 形式 ( complementary form ) 。 
“ 真 值 形式 ”不 表示 Ay TRUE, 仅仅 是 4 的 上 面 没 有 线 。 

一 项 或 者 多 项 的 AND PARRA (product) HEH Zi % A (implicant), AB, ABC, Ail B MBE 
3 个 变量 的 蕴涵 项 。 最 小 项 ( minterm) 是 一 个 包含 全 部 输入 变量 的 乘积 项 。A4 BC 是 输入 为 4、B、 
C 的 3 变量 函数 的 一 个 最 小 项 ， 但 是 4B 不 是 最 小 项 ， 因 为 它 不 包含 C。 同 样 ， 一 项 或 者 多 项 的 
或 (OR) 称 为 求 和 项 (sum)。 一 个 最 大 项 (maxterm) 是 包括 了 全 部 输入 项 的 和 。A+B+C 是 输入 
为 4、B、C 的 3 个 变量 函数 的 一 个 最 大 项 。 

在 解释 布尔 表达 式 时 ,运算 顺 序 很 重要 。 布 尔 表达 式 Y=4+BC 表示 Y= (A OR B) AND C, 
还 是 表示 Y=4 OR(B AND C)? 在 布尔 表达 式 中 ， 非 (NOT) 的 优先 级 最 高 ， 接 着 是 与 (AND)， 
最 后 是 或 (OR)。 对 于 一 个 普通 的 等 式 ， 乘积 在 求 和 之 前 执行 。 所 以 ， 等 式 读 作 Y=4 OR(B 
AND C) 。 式 (2-1) 给 出 了 运算 顺序 的 另 一 个 例子 。 

AB + BCD = ((A)B) + (BC(D)) (2-1) 


2.2,2 与 或 式 


有 个 输入 的 真 值 表 包 含 2" 行 ， 每 一 行 对 应 输入 变量 的 一 种 可 能 取 值 。 真 值 表 中 的 每 一 
行 都 与 一 个 为 TRUE 的 最 小 项 相关 联 。 图 2-8 为 一 个 有 2 个 输入 4 A BR, BA 
了 对 应 的 最 小 项 。 比 如 ， 第 一 行 的 最 小 项 是 48B， 因 为 当 4 =0,，B =0 时 ， AB 是 TRUE。 最 小 项 
从 0 开始 标号 。 第 一 行 对 应 于 最 小 项 0(m,) ， 下 一 行 对 应 于 最 小 项 1(m, ) ， 以 此 类 推 。 

可 以 用 输出 了 为 TRUE 的 所 有 最 小 项 之 和 的 形式 写 出 任意 一 个 真 值 表 的 布尔 表达 式 。 比 
如 ， 在 图 2-8 中 圈 起 来 的 区 域 中 只 有 一 行 (一 个 最 小 项 ) 的 输出 了 为 TRUE。 在 图 2-9 中 ,， 真 值 
表 中 有 多 行 的 输出 了 为 TRUE。 取 每 一 个 被 圈 起 来 的 最 小 项 之 和 ， 可 以 得 出 : Y=AB +4B。 








2-8 ” 真 值 表 和 最 小 项 图 2-9 包含 了 多 个 为 TRUE 的 最 小 项 的 真 值 表 


因为 这 种 形式 是 由 多 个 积 ( AND 构成 了 最 小 项 ) 的 和 (OR) 构 成， 所 以 它 称 为 函数 的 与 或 式 
(sum-of-product) 范式 。 虽 然 有 多 种 形式 表示 同一 个 函数 ， 比 如 图 2-9 的 真 值 表 可 以 写 为 
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Y=BA+BA, 但 可 以 将 它们 按照 它们 在 真 值 表 中 出 现 的 顺序 排序 ， 因 此 同一 个 真 值 表 总 是 能 
写 出 唯一 的 布尔 等 式 。 

与 或 式 范式 也 可 以 使 用 求 和 符号 L 写成 连续 相 加 的 形式 。 应 用 这 种 表示 法 ， 图 2-9 的 函 

数 形式 可 以 写成 : 
F(A,B) = X (m,,m,) 

或 (2-2) 
F(A B) = % (1,3) 

GBD 与 或 式 

Ben 正在 野 炊 ， 如 果 下 十 或 者 那儿 有 蚂蚁 Ben 将 不 能 享受 到 野 炊 的 快乐 。 设 计 一 个 电路 ， 
RAH Ben 享受 野 炊 时 ， 它 输出 TRUE, 

解 : 首先 定义 输入 和 输出 。 输 入 为 4 入， 它们 分 别 表示 有 蚂蚁 和 下 献 。 有 蚂蚁 时 4 是 
TRUE， 没 有 蚂蚁 时 4 为 FALSE。 同 样 ， 下 雨 时 RR 为 TRUE， 不 下 雨 时 RR 为 FALSE。 输 出 为 ， 
表示 Ben 的 野 炊 经 历 。 如 果 Ben 享受 野 炊 , EW TRUE, WẸ Ben RAHEEM, E 为 FALSE, 
图 2-10 表示 Ben 野 炊 经 历 的 真 值 表 。 

使 用 与 或 式 写 出 等 式 : =A4R。 可 以 用 2 个 道 变 器 (或 称 为 非 门 ) 和 2 个 与 (AND) 门 来 实现 
等 式 ， 如 图 2-11a 所 示 。 读 者 可 能 发 现 ， 这 个 真 值 表 是 1.5.5 节 中 出 现 的 或 非 ( NOR) A: 
E=ANORR =4+R。 图 2-11b 表示 或 非 运 算 。 在 2.3 节 中 ， 我 们 将 介绍 AR 和 4+R 这 2 个 等 











式 是 等 价 的 。 < 
A A 
; plat d ra 
Pata » b 
2-10 Ben 的 真 值 表 图 2-11 Ben 的 电路 


对 于 具有 任何 多 个 变量 的 真 值 表 ， 可 以 用 与 或 式 写 出 唯 








一 的 布尔 表达 式 。 图 2-12 表示 一 个 随机 3 输入 真 值 表 。 它 的 st 
逻辑 函数 的 与 或 式 为 : a DARAB 
Y=ABE6E+AB C+ABC Oi Atal -® 
1 0 0 il 
或 (2-3) 1 0 1 1 
Ma 2,(0,4,9) pide INE 1G 
但 是 ， 与 或 式 并 不 能 一 定 产生 最 简 的 等 式 。 在 2.3 节 中 ， | 

我 们 将 介绍 如 何 用 较 少 的 项 写 出 同样 的 函数 。 图 2-12 一 个 3 输入 真 值 表 

2.2.3 或 与 起 


布尔 函数 的 第 二 种 表达 式 是 或 与 式 (product-of- sums) 范式 。 真 值 表 的 每 一 行 对 应 为 FALSE 
的 一 个 最 大 项 。 比 如 ，2 输入 真 值 表 的 第 一 行 的 最 大 项 为 (4 + B)， 因 为 当 4 =0，B=0 时 ， 
(A+B) FALSE, 我们 可 以 直接 将 真 值 表 中 每 一 个 输出 为 
FALSE 的 最 大 项 相 与 (AND) 而 得 到 电路 的 布尔 表达 式 。 或 与 式 
范式 也 可 以 使 用 求 积 符号 开 写 成 连续 相 乘 的 形式 。 
GED 或 与 式 
为 图 2-13 中 的 真 值 表 写 出 一 个 或 与 式 表 达 式 。 图 2-13 包含 多 个 FALSE 最 
解 : 真 值 表 中 有 2 行 输出 为 FALSE， 所 以 函数 可 以 写成 或 大 项 的 真 值 表 
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与 式 : Y= (4+B)(4+ 有 8) 或 者 写成 Y= II(M，1M0 ) 或 者 Y= II(0，2) 。 第 一 个 最 大 项 为 
(A+B), 在 4=0 且 B=0 时 ,任何 值 与 0 相 与 (AND ) 都 等 于 0， 这 保证 了 Y=0。 同 样 ， 第 二 个 
最 大 项 为 (4+B), 在 4=1 且 B=0 时 ,保证 了 Y=0。 图 2-13 和 图 2-9 是 相同 的 真 值 表 ， 这 表明 
可 以 用 多 种 方法 写 出 同一 个 函数 。 < 

同样 ， 图 2-10 表示 Ben 野 炊 的 布尔 表达 式 ， 可 以 将 圈 起 来 的 3 个 为 0 的 行 写 成 或 与 式 ， 得 到 
E=(A+R)(4+R)(4A+R)。 它 比 与 或 式 的 E=AR 复 杂 , 但 这 两 个 等 式 在 逻辑 上 是 等 价 的 。 

当真 值 表 中 只 有 少数 行 输出 为 TRUE 时 ， 与 或 式 可 以 产 成 较 短 的 等 式 。 当 在 真 值 表 中 只 有 
少数 行 输出 为 FALSE 时 ， 或 与 式 比较 简单 。 


2.3 布尔 代数 


在 前 面 的 章节 中 ， 学 习 了 通过 给 定 的 真 值 表 如 何 写 出 布尔 表达 式 。 但 是 ， 表 达 式 不 能 导出 
一 组 最 简单 的 逻辑 门 。 与 使 用 代数 来 化 简 数 学 方程 式 一 样 ， 也 可 以 用 布尔 代数 来 化 简 布 尔 表达 
式 。 布 尔 代数 的 法 则 与 普通 的 代数 非常 相似 ， 而 且 在 某 些 情形 下 它 更 简单 ， 因 为 变量 只 有 0 和 
1 这 两 种 可 能 的 值 。 

布尔 代数 以 一 组 事先 假定 正确 的 公理 为 基础 。 公 理 是 不 用 证 明 的 ， 从 某 种 意义 上 说 ， 就 像 
定义 不 能 被 证 明 一 样 。 通 过 这 些 公理 ， 可 以 证 明 布 尔 代 数 的 所 有 和 定理。 这 些 定理 有 非常 大 的 实 
用 意义 ， 因 为 它们 指导 我 们 如 何 化 简 逻 辑 来 生成 较 小 且 成 本 更 低 的 电路 。 


表 2-1 布尔 代数 的 公理 





公理 对 偶 公 理 ”名 称 
Al B=0 如果 Bz1 Al’ B=1 MFR BHO 二 进 制 量 
A2 0=1 A2 1=0 NOT 
A3 0 .0 =0 A3’ 1+1=1 AND/OR 
A4 1-1=1 A4 0+0=0 AND/OR 
AS 0-1=1-0=0 AS 


1+0=04+1=1 AND/OR 


布尔 代数 的 公理 和 定理 都 服从 对 偶 原 理 。 如 果 符 号 0 和 1 互 换 ,操作 符 . (AND) Al + 
(OR) 互 换 ， 表达 式 将 依然 正确 。 我 们 用 上 标 (') 来 表示 对 侦 式 。 


2.3.1 公理 


表 2-1 给 出 了 布尔 代数 的 公理 。 这 5 个 公理 和 它们 的 对 偶 式 定义 了 布尔 变量 以 及 非 
(NOT) 、 或 (OR)、 与 (AND ) 的 含义 。 公 理 Al 表示 变量 要 么 是 1， 要么 是 0。 公理 的 对 偶 式 
Al 表示 变量 要 么 是 0， 要么 是 1。Al 和 Al 告诉 我 们 只 能 对 布尔 量 (二 进 制 量 )0 和 1 的 进行 运算 。 
公理 A2 A AEX PARISH. AM A3 ~ AS 定义 与 运算 ， 它 们 的 对 偶 式 AB’ ~ A5 "定义 了 或 运算 。 
2.3.2 单 变 量 定理 

表 2-2 中 的 定理 Tl ~ TS 描述 了 如 何 化 简 包 含 一 个 变量 的 等 式 。 

表 2-2 单 变量 的 布尔 代数 定理 


定理 对 偶 定 理 名 称 
Ti B-1=B T B+0=B 同一 性 定理 
T2 B- 0=0 T2’ B+1=1 零 元 定理 
T3 -B=B 13" B+B=B 重合 定理 
T4 B=B 回旋 定理 
T5 B+ B=0 TS’ B+B=1 互补 定理 
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同一 性 定理 Tl 表示 对 于 任何 布尔 变量 BB，B AND 1 = 下， 它 的 对 偶 式 表示 BOR0=B8。 在 
”图 2-14 的 硬件 中 ，T1 表示 在 2 输入 与 门 中 ， 如 果 有 一 个 输入 总 是 为 1， 则 可 以 删除 与 门 ， 用 连 
接 输入 变量 B 的 一 条 导线 代替 与 门 。 同 样 ，T1' 表 示 在 2 输入 或 门 中 ， 如 果 有 一 个 输入 总 是 为 
0， 则 可 以 用 连接 输入 变量 B 的 一 条 导线 代替 或 门 。 一 般 来 说 ， 逻 和 辑 门 需要 花费 成 本 、 功 耗 和 
延迟 ， 用 导线 来 代替 门 电路 是 有 利 的 。 

零 元 定理 T2 表示 B AND 0 总 是 等 于 0。 所 以 , 0 称 为 与 操作 的 零 元 ， 因 为 它 使 任何 其 他 输 
人 的 影响 无 效 。 对 偶 式 表明 ，B OR 1 总 是 等 于 1。 所 以 ，1 是 或 操作 的 零 元 。 在 图 2-15 所 示 的 
硬件 电路 中 ， 如 果 一 个 AND 门 的 输入 是 0， 则 可 以 用 连接 低 电 平 (0) 的 一 条 导线 代替 与 门 。 同 
样 ， 如 果 一 个 OR 门 的 输入 是 1， 则 可 以 用 连接 高 电 平 (1) 的 一 条 导线 代替 或 门 。 


Ri 
a) b) a ) b) 
图 2-14 同一 性 定理 的 硬件 解释 图 2-15” 零 元 定理 的 硬件 解释 
重合 定理 T3 表示 变量 和 它 自身 相 与 (AND ) 就 等 于 它 本 身 。 同 样 ， 一 个 变量 和 它 自 身 相 或 
(OR) 等 于 它 本 身 。 从 拉丁 语词 根 给 出 了 定理 的 名 字 : 同一 的 和 强 有 力 的 。 这 个 操作 返回 和 输 
人 相同 的 值 。 如 图 2-16 所 示 ， 重 全 定理 也 允许 用 一 条 导线 来 代替 门 。 
回旋 定理 T4 说 明 对 一 个 变量 进行 2 次 求 补 可 以 得 到 原来 的 变量 。 在 数字 电子 学 中 ， 两 次 
错误 将 产生 一 个 正确 结果 。 串 联 的 2 个 道 变 右 (或 称 为 非 门 、 反 相 器 ) 在 逻辑 上 等 效 于 一 条 导 
线 ， 如 图 2-17 所 示 。T4 的 对 偶 式 是 它 自身 。 


sis 3 >0] Do =B 


























图 2-16， 重 又 定理 的 硬件 解释 图 2-17 回旋 定理 的 硬件 解释 
互补 定理 T5( 见 图 2-18) 表 示 一 个 变量 和 它 pg B i 

自己 的 补 相 与 (AND) 结 果 是 0( 因 为 它们 中 的 一 了 六 = ps 

个 必然 是 0) 。 同 时 ， 对 偶 式 表明 一 个 变量 与 它 a) b) 

自己 的 补 相 或 (OR ) 结果 是 1( 因 为 它们 中 必然 图 2-18 互补 定理 的 硬件 解释 

有 一 个 值 为 1) 。 


2.3.3 多 变量 定理 
表 2-3 中 的 定理 TO ~ T12 描述 了 如 何 化 简 包 含 多 个 变量 的 布尔 表达 式 。 
表 2-3 多 变量 的 布尔 定理 


定理 对 偶 定 理 名 称 
T6 B-C=C-B T6' B+C=C+B 交换 律 
T7 (B.C).D=B.(C.D) T7! (B+C)+D=B+(C+D) 结合 律 
T8 (B-C)+(B+D) =B+ (C+D) T8’ (B+C)+(B+D) =B+(C-D) 分 配 律 
T9 B - (B+C) =B To’  B+(B-C)=B 吸收 律 
T10 (B-C)+(B-C) =B T10’ (B+C) -(B+C)=B 合并 律 
T11 (B-C)+(B-D)+(C-D) mi’ (B +C) - (B +D) « (C+D) 一 致 律 
=B.C+B.D =(B+C) -(B+D) 


T12 Bo is B; ~ B, ++ = (Bo +B, +B) T12’ Bo +B, + By+* = (Bo a B, a By***) 德 a 摩根 定理 


~ E 


交换 律 T6 和 结合 律 T7 与 传统 代数 相同 。 交 换 律 表明 与 (AND) 或 者 或 (OR) 函数 的 输入 顺 
序 不 影响 输出 的 值 。 结 合 律 表明 特定 输入 的 分 组 不 影响 输出 的 值 。 

分 配 律 T8 与 传统 代数 相同 。 但 是 它 的 对 偶 式 T8' 不 同 。 在 T8 中 与 (AND ) 的 分 配 高 于 或 
(OR) ,在 T8' 中 或 (OR) 的 分 配 高 于 与 (AND)。 在 传统 代数 中 ， 乘法 分 配 高 于 加 法 ,但 是 加 法 
分 配 不 高 于 乘法 。 因 此 (B+C) x (B+D) #B+(CxD), 

吸收 律 9、 合并 律 T10 和 一 致 律 T11 允许 消除 元 余 变 量 。 读 者 应 该 能 够 通过 思考 自己 证 
明 这 些 定理 的 正确 性 。 

德 . 摩根 定理 T12 是 数字 设计 中 非常 有 力 的 工具 。 该 定理 说 明 ， 所 有 项 乘积 的 补 等 于 每 个 
项 各 自 取 补 后 相 加 。 同 样 ， 所 有 项 相 加 的 补 等 于 每 个 项 各 自 取 补 后 相 来 。 

根据 德 . 摩根 定理 ， 一 个 与 非 门 等 效 于 一 个 带 逆 变 器 输入 的 或 门 。 同 样 ， 一 个 或 非 门 等 效 
于 一 个 带 反 向 输入 的 与 门 。 每 个 函数 的 这 两 种 表达 式 称 为 对 偶 式 。 它 们 是 逻辑 等 效 的 ， 可 以 相 
互 替换 。 

逆 变 器 也 可 称 为 气泡 (bubble)。 你 可 以 想象 ，“ 推 ” NAND NOR 
一 个 气泡 通过 门 使 它 从 门 的 一 边 输入 ,在 另 一 边 输 出 ， 
可 以 将 与 门 奉 换 成 或 门 ， 反之 亦 然 。 例如， 图 2-19 中 的 
与 非 门 是 输出 端 包含 气泡 的 与 门 。 推 一 个 气泡 到 左边 会 
导致 输入 端 带 有 气泡 ， 并 将 与 门 变 成 或 门 。 下 面 是 推 气 
泡 的 规则 : 

。 从 输出 端 向 后 推 气泡 或 者 从 输入 端 向 前 推 气泡 ， 将 

与 门 换 成 或 门 ， 反 之 亦 然 。 

。 从 输出 端 推 气泡 返回 到 输入 端 ， 把 气泡 放置 在 门 的 

输入 端 。 

。 向 前 推 所 有 门 输入 端的 气泡 ， 把 气泡 放 在 门 的 输 ”图 2-19 W- 摩根 定理 的 等 价 门 

出 端 。 

2.5. 2 节 将 使 用 推 气泡 方法 来 分 析 电 路 。 

推导 出 或 与 式 

图 2-20 给 出 布尔 函数 工 的 真 值 表 ， 以 及 它 的 反 Y。 使 用 德 ， 摩根 定理 ， 通 过 了 的 与 或 式 ， 
推导 出 工 的 或 与 式 。 

解 : 图 2-21 圈 起 来 的 部 分 表示 了 中 的 最 小 项 , 了 的 与 或 式 为 








Y=AB+AB (2-4) 
等 式 两 边 同时 取 反 ， 并 应 用 德 ， 摩根 定理 2 次 ， 可 以 得 到 
Y = Y =A B+AB = (A B)(AB) = (A+B)(A+B) (2-5) 





A 
0 
0 
1 
1 





图 2-20 YAY HHHK 图 2-21 了 最 小 项 的 真 值 表 E 


2.3.4 定理 的 统一 证 明 方 法 
好 奇 的 读者 可 能 想 知 道 如 何 证 明定 理 的 正确 性 。 在 布尔 代数 中 , 证 明 具 有 有 限 变量 数 的 定 
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理 的 方法 很 简单 : 只 要 证 明 针对 变量 的 所 有 可 能 值 ， 定 理 都 是 正确 的 。 这 个 方法 叫 作 完全 归纳 
法 ， 可 以 通过 真 值 表 完 成 证 明 。 








B C D| BC+BD+CD | BC+BD 
使 用 完全 归纳 法 证 明 一 致 律 定理 00 
证 明 表 2-3 中 的 一 致 律 定理 Tl1。 ge G 0 0 
解 : eet B, CMDNS HAA. mM 1 1 1 > é 
图 2-22 所 示 的 真 值 表 列 出 了 它们 的 组 合 。 因 为 在 所 有 可 : 
能 中 均 有 BC+BD+CD=BC+BD， 所 以 定理 得 证 。 看 1 1 1 1 1 
2.3.5 等 式 化 简 图 2-22 证 明 Tll 的 真 值 表 


布尔 代数 定理 有 助 于 化 简 布 尔 表达 式 。 例 如 ， 考 虑 图 2-9 中 真 值 表 的 与 或 式 : Y = AB + 
A B。 应 用 定理 T10， 等 式 可 以 化 简 为 Y= B。 这 在 真 值 表 中 是 显而易见 的 。 通 常 ， 要 化 简 复 杂 
的 等 式 需 要 多 个 步骤 。 

化 简 与 或 式 的 基本 原则 是 使 用 关系 PA +PA=P 来 合并 项 ， 其 中 PP 可 以 是 任意 蕴涵 项 。 一 
个 等 式 可 以 化 简 到 什么 地 步 呢 ?我 们 称 使 用 了 最 少 蕴涵 项 的 等 式 为 最 小 与 或 式 。 对 于 具有 相同 
数量 蕴涵 项 的 多 个 等 式 ， 具 有 最 少 项 数 的 与 或 式 是 最 小 与 或 式 。 

如 果 蕴 含 项 不 能 与 其 他 蕴含 项 合并 生成 具有 较 少 项 的 形式 ， 那 么 此 蕴含 项 称 为 主 蕴 含 项 。 
最 小 等 式 中 的 蕴含 项 必须 都 是 主 蕴 含 项 。 否 则 ， 就 可 以 合并 它们 来 减少 项 的 数量 。 

最 小 化 等 式 


最 小 化 式 (2-3): ABC+ABC+ABC, 表 2-4 ”等 式 化 简 

解 : 从 原 等 式 开始 ， 如 表 2-4 所 示 , 一 步 一 PR 等 式  _《 应 用 的 定理 
步 地 运用 布尔 定理 。 ABC+ABC+ABC 

此 时 我 们 已 经 完全 化 简 了 等 式 吗 ? 让 我 们 进 I BC(A+A) +4BC T8: 分 配 律 
一 步 仔 细 分 析 。 根 据 原 等 式 ， 最 小 项 4 BC 和 2  BC(1)+ABC TS; 互补 定理 
A BC 仅仅 在 变量 4 上 不 同 。 于 是 可 以 合并 最 小 _3 BC+ABC Tl: 同性 定理 


项 为 BC。 然 而 ， 继 续 观察 原 等 式 ， 我 们 注意 到 
最 后 两 个 最 小 项 4 B CHI A BC 同样 只 有 一 项 不 同 (C 和 C) 。 因 此 ， 应 用 相同 的 方法 可 以 合并 这 
两 个 最 小 项 形成 最 小 项 4 B。 我 们 称 蕴涵 项 B CAA B 共 享 最 小 项 4 BC. 

AGA, 我 们 只 化 简 这 两 个 最 小 项 对 中 的 一 个 ， 还 是 都 化 简 呢 ?应 用 重生 定理 ， 可 以 复制 我 
们 想 要 的 项 : B=B+B+B+B…。 运 用 这 个 原理 ， 我 们 可 以 完全 化 简 该 等 式 使 它 成 为 两 个 主旨 
含 项 ，B C +4 B， 如 表 2-5 所 示 。 gs 表 2-5 进一步 的 等 式 化 简 

展开 蕴涵 项 (比如 , 将 4B 变 成 4BC + ABC) 步骤 等 式 应 用 的 定理 
有 时 在 化 简 等 式 时 是 很 有 用 的 (虽然 它 有 一 点 违 
反 直觉 )。 通 过 展开 蕴含 项 ， 可 以 重复 一 个 展开 
的 最 小 项 使 它 与 其 他 最 小 项 合并 。 


ABC+A BC+ABC 
ABC+ABC+ABC+ABC T: RAEM 


1 
2 BC(A+A)+AB(C+C) 18: 分 配 律 
读者 可 能 已 经 注意 到 ， 完 全 使 用 布尔 代数 定 3 BG) +A BCL) TS: 互补 定理 
理 来 化 简 布 尔 表 达 式 可 能 带 来 很 多 错误 。2.7 市 4 BC+AB T1 ， 同 性 定理 


介绍 的 卡 诺 图 (Karnaugh map ) 化 简 技 术 将 使 处 理 
简单 一 些 。 

如 果 布 尔 表 达 式 是 逻辑 表达 式 ， 为 什么 要 花费 精力 化 简 它 呢 ? 化 简 减 少 了 物理 实现 逻辑 功 
能 所 需要 的 门 的 数量 ， 从 而 使 实现 电路 更 小 、 更 便宜 ， 可 能 还 更 快 。 下 一 节 将 介绍 如 何 用 逻辑 
门 实现 布尔 表达 式 。 | | 
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2.4 ”从 逻辑 到 门 | 
电路 原理 图 ( schematic) 描 述 了 数字 电路 的 内 部 元 件 及 其 相互 连接 。 例 如 ， 图 2-23 中 的 原 


理 图 表示 前 面 所 讨论 的 逻辑 函数 ( 式 (2-3) ) 的 一 种 可 能 的 硬件 实现 。 


Y=ABC+ABC+ABC 


ABC 
i; ABC 


ABC 





图 2-23 Y=ABC+ABC+A BC 的 电路 原理 图 


原理 图 需要 遵循 一 致 的 风格 ， 使 得 它们 更 加 易于 阅读 和 检查 错误 ， 
通常 遵循 以 下 的 准则 : 


输入 在 原理 图 的 左边 (或 者 顶部 )。 

输出 在 原理 图 的 右边 (或 者 底部 ) 。 

无 论 何 时 ， 门 必须 从 左 至 右 流 。 

最 好 使 用 直线 而 不 使 用 有 很 多 拐角 的 线 (交错 的 线 浪 费 精 力 考虑 
如 何 走 线 ) 。 

线 总 是 在 T 型 接头 连接 。 

在 两 条 线 交 叉 的 地 方 有 一 个 点 ， 表 示 它 们 之 间 有 连接 。 

在 两 条 线 交 叉 的 地 方 没有 点 ， 表 示 它 们 没有 连接 。 


图 2-24 说 明了 最 后 3 条 准则 。 

任何 布尔 表达 式 的 与 或 式 可 以 用 系统 的 方法 画 成 与 图 2-23 相似 的 
原理 图 。 按 列 画 出 输入 ， 如 果 有 需要 则 在 相 邻 列 之 间 放 置 道 变 器 提供 
输入 信号 的 补 。 画 一 行 与 门 来 实现 每 个 最 小 项 。 对 于 每 一 个 输出 画 一 
个 或 门 来 连接 和 输出 有 关 的 最 小 项 。 因 为 道 变 器 、 与 门 和 或 门 按照 系 
统 风 格 排列 ， 所 以 这 种 设计 称 为 可 编程 逻辑 阵列 ( Programmable Logic Array, PLA), PLA 将 
在 5.6 节 中 讨论 。 

图 2-25 给 出 了 例 2. 6 中 使 用 布尔 代数 化 简 后 等 式 的 实现 。 与 图 2-23 相 比 ， 简 化 后 电路 所 
需要 的 硬件 明显 减少 。 因 为 其 逻辑 门 的 输入 更 少 ， 所 以 化 简 后 电路 的 速度 可 能 更 快 。 

可 以 利用 反 向 门 (尽管 只 有 一 个 逆 变 器 ) 进一步 减少 门 的 数量 。 注 意 B C 是 一 个 带 反 向 输入 
的 与 门 。 图 2-26 给 出 了 消除 C 上 逆 变 器 的 优化 实现 原理 图 。 利 用 德 . 摩根 定理 ， 带 反 向 输入 
的 与 门 等 效 于 一 个 或 非 门 。 基 于 不 同 的 实现 技术 ， 使 用 更 少 的 门 或 者 使 用 某 几 种 适合 特定 工艺 
的 门 会 更 便宜 。 例 如 ， 在 CMOS 实现 中 ,与 非 门 和 或 非 门 优先 于 与 门 和 或 门 。 

许多 电路 都 有 多 个 输出 。 针 对 每 一 个 输出 分 别 计算 输入 的 布尔 函数 。 可 以 分 别 写 出 每 个 输 
出 的 真 值 表 。 但 更 方便 的 方法 是 在 一 个 真 值 表 中 写 出 所 有 输出 ， 并 画 出 具有 所 有 输出 的 原 


理 图 。 


走 线 在 T 
接头 连接 


线 在 有 点 
的 地 方 连接 


十 


线 交 叉 时 如 果 
没有 点 ， 则 表示 
两 条 线 之 间 无 连接 


= 


图 2-24 线 的 连接 


38 第 2 章 


A B C 
A B oG 
r 
图 2-25 Y=BC+4B 的 原理 图 图 2-26 ”使 用 更 少 门 的 原理 图 


多 输出 电路 

院 长 、 系 主任 、 助 教 和 寝室 长 有 时 都 会 使 用 礼堂 。 
不 第 的 是 ， 他 们 偶尔 会 发 生 冲 突 。 比 如 ， 系 主任 准备 和 
一 些 理事 在 礼 党 召开 一 个 会 议 , 与 此 同时 ,寝室 长 准备 
举行 BTB 晚会 。Alyssa P. Hacker 要 设计 一 个 礼 党 的 预定 
系统 。 

这 个 系统 有 4 个 输入 4 ++, Ay 和 4 个 输出 ，…， 
Y】,。 这 些 信 和 号 也 可 以 写成 4;.。 和 了 站.,。。 当 用 户 要 求 预定 明天 
的 礼堂 时 将 其 对 应 的 输入 设置 为 TRUE。 系 统 给 出 的 输出 
中 最 多 有 一 个 为 TRUE， 从 而 将 礼堂 的 使 用 权 给 优先 级 最 
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0 0 0 0 0 0 0 0 
高 的 用 户 。 院 长 在 系统 中 的 优先 级 最 高 (3)， 系 主任 、 助 pe hl ee ER- 
教 和 寝室 长 的 优先 级 依次 递减 。 0-0 Ml © 1 © 
为 系统 写 出 真 值 表 和 布尔 表达 式 ， 画 出 电路 来 实现 这 0 1 0 CFO 1 0 o 
个 功能 。 gi ay ag nga se gg 
解 : 这 个 功能 称 为 4 输入 优先 级 电路 。 它 的 电路 符号 1 5 olf lle 
和 真 值 表 如 图 2-27 所 示 。 i : ° S 1 - ; 
可 以 写 出 每 个 输出 的 与 或 式 ， 并 使 用 布尔 代数 来 化 1 o 1 ılı 0 0 0 
简 等 式 。 根 据 功能 描述 ( 和 真 值 表 ) 可 以 很 清楚 地 检查 化 1 1 0 Ot 0 0 o 
简 后 的 等 式 : 当 4 AAN, Y Æ RUE, FHY,=A,, 1 1 1 olr 0 0 o 
4 A, ARLA A, GRR, Y HE TRUE, MIL Y,=4,A,, 4% ~~ > 7 7Ee o. 9 9 
A, 有 效 且 没有 更 高 优先 级 的 信号 有 效 时 ,Yi 为 TRUE, 图 2-27 优先 级 电路 
FELA Y, =4,4,4,。 当 4。 有效 且 没有 其 他 信号 有 效 时 ， YY, 为 
TRUE ， 所 以 蕊 =A,4,414。。 图 2-28 给 出 了 原理 图 。 有 经 验 A; A, A, Ag 
的 设计 师 经 常 通过 观察 来 实现 逻辑 电路 。 对 于 给 定 的 设计 规 Ms 
范 ， 简 单 地 把 文字 转变 成 布尔 表达 式 ， 再 把 表达 式 转变 成 门 
电路 。 < Y, 
注意 在 优先 级 电路 中 如 果 4; 为 TRUE， 则 输出 不 用 考虑 
其 他 输入 量 。 用 符号 X 表示 输出 不 需要 考虑 的 输入 。 图 2-29 Yo 


中 带 无 关 项 的 4 输入 优先 级 电路 的 真 值 表 变 得 更 小 了 。 这 个 | Å 
真 值 表 通 过 无 关 项 X 可 以 很 容易 地 读 出 布尔 表达 式 的 与 或 ”< 优先 级 电路 的 原理 图 
式 。 无 关 项 也 可 以 出 现在 真 值 表 的 输出 项 中 ， 这 将 在 2.7.3 节 中 讨论 。 
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2.5 多 级 组 合 逻 辑 


与 或 式 称 为 二 级 逻辑 ， 因 为 它 在 一 级 与 门 中 连接 所 有 的 输入 信和 号， 然后 再 连接 到 一 级 或 
门 。 设 计 师 经 常用 多 于 两 个 级 别 的 逻辑 门 建立 电路 。 这 些 多 级 组 合 电路 使 用 的 硬件 比 两 级 组 合 
电路 更 少 。 推 气泡 方法 在 分 析 和 设计 多 级 电路 中 尤其 有 帮助 。 


2.5.1 减少 硬件 


当 使 用 两 级 逻辑 时 ， 有 些 逻 辑 函 数 要 求 数 量 巨 大 的 硬件 。 一 个 典型 的 例子 是 多 变量 的 异 或 
门 函数 。 例 如 ， 采 用 所 学 的 方法 用 两 级 逻辑 建立 一 个 3 输入 异 或 门 电路 。 

注意 对 于 一 个 入 输入 异 或 门 ， 当 奇数 输入 为 TRUE 时 输出 为 TRUE。 图 2-30 表示 一 个 3 输 
人 异 或 门 的 真 值 表 ， 其 中 带 圈 行 的 输出 为 TRUE。 通 过 真 值 表 ， 可 以 读 出 布尔 表达 式 的 与 或 式 ， 
如 式 (2-6) 所 示 。 不 全 的 是 ， 没 有 办 法 把 这 个 等 式 化 简 为 较 小 的 荀 涵 项 。 





a) 功能 规范 b) 两 级 逻辑 实现 
图 2-30 3 输入 异 或 门 
FY =ABC+ABC+ABC+ABC (2-6) 

男 一 方面 ，4@8B8@C = (AMB) 由 C( 如 果 有 疑问 ， 可 以 通过 a] 
归纳 法 证 明 ) 。 因 此 ，3 输入 异 或 门 可 以 通过 串联 两 个 2 输入 异 p B Tah 
或 门 来 构造 ， 如 图 2-31 所 示 。 

同样 ， 一 个 8 输入 蜡 或 门 的 两 级 与 或 式 逻 辑 实 现 需 要 128 图 2-31 使 用 两 个 2 输入 异 或 门 
个 8 位 输入 的 与 门 和 一 个 128 位 输入 的 或 门 。 一 个 更 好 的 选择 构造 一 个 3 输入 异 或 门 


是 使 用 2 输入 异 或 门 的 树 构成 ， 如 图 2-32 所 示 。 
选择 最 好 的 多 级 结构 来 实现 特定 逻辑 函数 不 是 一 个 简单 的 过 程 。 而 且 , “最 好 的 ”标准 
有 多 重 含 义 : 门 的 数量 最 少 、 速 度 最 快 、 设 计时 间 最 短 、 花 费 最 少 或 功 耗 最 低 等 。 第 $ 章 将 


67 


’ 
72 


40 


第 2 章 


看 到 在 某 个 工艺 中 最 好 的 电路 在 另 一 种 工艺 中 并 不 是 最 好 的 。 比 如 ， 我 们 经 常 使 用 的 与 门 


和 或 门 ， 但 是 在 CMOS 电路 中 与 非 门 和 或 非 门 会 更 有 效 
率 。 通 过 积累 一 些 设计 经 验 ， 你 会 发 现 对 于 大 多 数 的 电 
路 可 以 通过 观察 的 方法 来 设计 一 个 好 的 多 级 电路 设计 。 
通过 学 习 本 书后 续 章 节 的 电路 实例 ， 你 可 以 获得 一 些 经 
验 。 在 学 习 过 程 中 ， 我 们 将 探讨 各 种 不 同 的 设计 策略 并 
权衡 选择 。 计 算 机 辅助 设计 (CAD ) 工 具 通常 也 可 以 有 效 
地 发 现 更 多 可 能 的 多 级 设计 ， 并且 按照 给 定 的 限制 条 件 
寻找 最 好 的 设计 。 


2.5.2 ESH 


1.7.6 节 介 绍 的 CMOS 电路 更 偏爱 与 非 门 和 或 非 门 而 
不 是 与 门 和 或 门 。 但 是 从 带 有 与 非 门 和 或 非 门 的 多 级 电路 
读 出 布尔 表达 式 ， 可 能 会 相当 头痛 。 难 以 通过 观察 方法 立 
刻 得 到 图 2-33 中 多 级 电路 的 布尔 表达 式 。 推 气泡 可 以 帮助 
重 画 这 些 电路 ， 以 便 消 除 气泡 并 比较 容易 地 确定 逻辑 功 
HE. MH 2. 3. 3 节 中 的 原则 ， 推 气泡 方法 如 下 : 

e 从 电路 的 输出 端 开 始 并 向 输入 方向 推 。 

。 将 气泡 从 最 后 的 输出 端 向 输入 端 推 ， 这 样 读 出 输 

ACY) 的 布尔 表达 式 ， 而 不 是 输出 取 反 (了 ) 的 表 

达 式 。 

。 继续 回 后 推 ， 以 便 画 出 每 个 门 来 消除 气泡 。 如 果 
当前 门 有 一 个 输入 气泡 ， 则 在 其 前 面 门 的 输出 加 
上 气泡 。 如 果 当 前 门 没有 输入 气泡 ， 则 其 前 面 的 
门 也 不 带 输 出 气泡 。 

图 2-34 显示 了 如 何 根据 推 气泡 规则 重 画 图 2-33。 从 
输出 了 开始 ， 与 非 门 的 输出 有 和 希望 去 除 的 气泡 。 将 输出 气 
泡 回 后 推 以 便 产 生 一 个 带 反 向 输入 的 或 门 ， 如 图 2-34 所 
示 。 继 续 向 左 看 ， 最 右边 门 有 一 个 输入 气泡 ， 它 可 以 删除 
中 间 与 非 门 的 输出 气泡 ， 因 此 这 个 与 非 门 不 需要 变化 ， 如 
图 2-34b 所 示 。 中 间 门 没有 输入 气泡 ， 因 此 可 将 最 左边 门 
转变 成 不 带 输出 气泡 的 门 ， 如 图 2-34c 所 示 。 现 在 所 有 除 
了 输入 以 外 电路 中 的 气泡 都 已 经 删除 了 ， 于 是 可 以 通过 观 
察 产 生 基于 输入 的 真 值 形式 或 取 反 形式 的 AND 或 OR 来 构 
成 表 项 。 其 表达 式 为 : Y=4 BC+D。 

为 了 强调 最 后 一 点 ， 图 2-35 显示 了 与 图 2-34 电路 等 
效 的 逻辑 电路 。 内 部 结 点 的 函数 标 成 灰色 。 因 为 气泡 是 串 
联 删除 的 ， 所 以 可 以 忽略 中 间 门 的 输出 气泡 和 最 右边 门 的 输 
人 和 人 气泡， 以便 产生 一 个 逻辑 等 效 电路 图 ， 如 图 2-35 所 示 。 

为 CMOS 逻辑 推 气泡 


DD, 
Bo 


图 2-32 用 7 个 2 输入 异 或 门 来 构造 


一 个 8 输入 异 或 门 
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图 2-33 {EH NAND (与 非 门 ) 和 NOR 
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(或 非 门 ) 的 多 级 电路 


没有 输出 气泡 


a) 


输入 和 输出 有 气泡 
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没有 气泡 
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图 2-34 推 气泡 法 产生 的 电路 
AB 


ABC 


Y=ABC+D 


很 多 设计 师 按照 与 门 和 或 门 来 思考 ， 但 是 假设 需要 用 图 2-35 采用 推 气泡 法 产生 的 逻辑 等 


CMOS 来 实现 图 2-36 所 示 的 逻辑 电路 ， 而 CMOS 逻辑 电路 


价 电路 
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偏向 于 使 用 与 非 门 和 或 非 门 。 使 用 推 气泡 将 电路 转变 为 使 用 与 非 门 、 或 非 门 和 非 门 实现 。 
解 : 蛮 力 解决 方案 是 用 与 非 门 和 非 门 代替 每 一 个 与 门 ， 用 
或 非 门 和 非 门 代替 每 一 个 或 门 ， 如 图 2-37 所 示 。 这 种 方法 需要 
8 个 门 。 注 意 这 里 非 门 的 气泡 画 在 前 面 而 不 是 后 面 ， 以 便 重 点 
讨论 如 何 用 前 面 的 非 门 删除 气泡 。 
一 种 较 好 的 解决 方案 是 ,气泡 可 以 添加 到 门 的 输出 和 下 一 
个 门 的 输入 而 不 改变 逻辑 功能 ， 如 图 2-38a 所 示 。 最 后 一 个 与 图 2-36 使 用 与 门 (AND ) 和 或 
门 改变 成 一 个 与 非 门 和 一 个 非 门 ， 如 图 2-38b 所 示 。 这 种 解决 门 (OR) 的 电路 
方案 只 需要 5 个 门 。 4 


图 2-37 ”使 用 与 非 门 (NAND ) 和 或 非 门 (NOR) 实现 的 较 差 电 路 


图 2-38 使 用 与 非 门 (NAND) 和 或 非 门 (NOR) 实 现 的 较 好 电路 


2.6 XMZ 
布尔 代数 限制 为 0 和 1。 然而 ， 真 实 电 路 中 会 出 现 非法 值 和 浮 空 值 ， 分 别 用 X A Z 来 表示 。 
2.6.1 非法 值 X 


符号 X 表示 电路 结 点 有 未 知 (unknown) 或 非法 (illegal) 值 。 这 通常 发 生 在 此 结 点 同时 被 0 
或 者 1 驱动 时 。 图 2-39 显示 了 这 种 情况 ， 结 点 了 同时 被 高 电 平和 Ae 
低 电 平 驱 动 ， 这 种 情况 称 为 竞争 ( contention ) ， 这 是 必须 避免 的 rx 
错误 。 在 竞争 结 点 上 的 真实 电压 可 能 处 于 0 ~ WV, 之 间 ， 取 决 于 了 驱 B=0 
动 高 电 平和 低 电 平 两 个 门 的 相对 强度 。 它 经 常 ,但 也 不 总 是 ， 处 图 2.39 有 竞争 的 电路 
于 禁止 区 域内 。 竞 争 还 可 能 导致 大 电流 在 两 个 竞争 的 门 之 间 流 
动 ， 使 得 电路 发 热 并 可 能 被 损坏 。 

X 值 有 时 也 被 电路 仿真 器 用 来 表示 一 个 没有 初始 化 的 值 。 比 如 ， 忘 了 明确 说 明 一 个 输入 的 
值 ， 仿 真 器 将 假定 它 的 值 是 X 而 发 出 警告 。 

回忆 2.4 节 的 内 容 ， 数 字 设 计 师 经 常 使 用 符号 X 来 表示 在 真 值 表 中 不 用 关心 的 值 。 一 定 不 
要 混 消 这 两 种 意义 。 当 X 出 现在 真 值 表 中 时 ， 它 表示 不 重要 的 值 。 当 X 出 现在 电路 中 时 ， 它 
的 意思 是 电路 结 点 有 未 知 值 或 非法 值 。 


2.6.2 序 空 值 Z 
符号 Z 表示 结 点 既 没 有 被 高 电 平 驱 动 也 没有 被 低 电 平 驱动 。 这 个 结 点 称 为 浮 空 floating ) 、 
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高 阻 态 (high impedance) ， 或 者 高 Z 态 。 一 个 典型 的 误解 是 将 浮 空 或 未 被 驱动 的 结 点 与 逻辑 0 
等 同 。 事 实 上 ， 这 个 浮 空 结 点 可 能 是 0 也 可 能 是 1， 也 有 可 能 是 0 ~1 之 间 的 电压 。 这 取决 于 系 
统 的 先前 状态 。 一 个 浮 空 结 点 并 不 意味 着 电路 出 错 ， 一 旦 其 他 电路 元 件 将 这 个 结 点 驱动 到 有 效 
电 平 ， 这 个 结 点 上 的 值 就 可 以 参与 电路 操作 。 

产生 浮 空 结 点 的 常见 原因 是 忘记 将 电压 连接 到 输入 端 ， 或 者 假定 这 个 没有 连接 的 输入 为 
0。 当 浮 空 输入 在 0 ~1 之 间 随 机 变化 时 ,这 种 错误 可 能 导致 电路 的 行为 不 确定 。 实 际 上 ， 人 接 
触电 路 时 ， 体 内 的 静电 就 可 能 足够 触发 改变 。 曾 经 发 现 只 有 在 学 生 把 一 个 手指 压 在 必 片 上 时 ， 
电路 才能 正确 运行 。 

图 2-40 所 示 的 三 态 缓冲 器 (tristate buffer), A 3 种 可 能 输出 状态 : 高 电 平 HCH(1) 、 低 电 
平 LOW(0) 和 浮 空 (Z) 。 三 态 缓冲 器 有 输入 端 4、 输 出 端 了 上 和 使 能 控制 端正 。 当 使 能 端 为 TRUE 
时 ， eT a 将 输入 值 传送 到 输出 端 。 当 使 能 端 为 FALSE 时 ， 输 
出 被 设置 为 浮 空 (Z)。 

图 2-40 中 的 三 态 缓冲 器 的 使 能 端 是 高 电 平 有 效 。 也 就 是 说 ， 使 能 端 为 高 电 平 HIGH(1) 时 ， 
缓冲 器 使 能 。 图 2-41 给 出 了 低 电 平 有 效 使 能 端的 三 态 缓冲 器 。 当 使 能 端 为 低 电 平 LOW(0) 时 ， 三 
态 缓冲 器 使 能 。 为 了 表示 信和 号 在 低 电 平时 有 效 ， 通 常 在 输入 线 上 放置 一 个 气泡 ， 也 经 常 在 它 的 名 
字 上 面 画 一 条 横 线 巨 ， 或 者 在 它 的 名 字 之 后 添加 字母 “b” 或 者 单词 “bar”， 了 Eb 或 者 Ebar, 


三 态 缓冲 器 


Phe 





图 2-40 三 态 缓冲 器 图 2-4. 低 电 平 有 效 使 能 的 三 态 缓冲 需 


三 态 缓冲 硕 经 稼 在 连接 多 个 芯片 的 总 线 上 使 用 。 例 
如 ， 微 处 理 侨 、 视 频 控制 器 和 以 太 网 控制 器 都 可 能 需要 
与 个 人 计算 机 中 的 存储 器 系统 通信 。 每 个 芯片 可 以 通过 
三 态 缓冲 句 与 共享 存储 器 总 线 连接 ， 如 图 2-42 所 示 。 
在 某 一 个 时 刻 只 人 允许 一 个 芯片 的 使 能 信号 有 效 来 向 总 线 
驱动 数据 。 而 其 他 芯片 的 输出 必须 为 浮 空 ， 以 防止 它们 
和 正 与 存储 器 通信 的 芯片 产生 竞争 。 任 何 世 片 在 任何 时 
刻 都 可 以 通过 共享 总 线 来 读 取信 息 。 这 样 的 三 态 总 线 曾 
经 非常 普遍 。 但 是 ， 在 现代 计算 机 中 需要 点 到 点 链 路 
( point-to-point link ) 以 便 获 得 更 高 的 速度 。 此 时 芯片 之 
间 就 是 直接 连接 而 不 再 通过 共享 的 总 线 。 


2.7 PEE 


通过 使 用 布尔 代数 对 多 个 布尔 表达 式 进行 化 简 , 我 SO BRST RNS See 
们 发 现 ， 如 果 不 小 心 ， 有 时 会 得 到 完全 不 同 的 表达 式 ， 而 不 是 最 简 的 表达 式 。 卡 诺 图 ( Kar- 
naugh map, K-map) 是 一 种 图 形 化 的 化 简 布 尔 表达 式 的 方法 ， 由 贝尔 实验 室 的 电信 工程 师 Mau- 
rice Karnaugh 于 1953 年 发 明 。 卡 诺 图 对 处 理 最 多 4 个 变量 的 问题 非常 好 。 更 重要 的 是 ， 它 给 出 
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了 操作 布尔 表达 式 的 可 视 化 方法 。 

逻辑 化 简 过 程 中 需要 组 合 不 同 的 项 。 如 果 两 项 包含 同一 个 区 涵 项 已 ， 并 包含 其 个 变量 4 的 
值 形 式 和 取 反 形式 ， 那 么 这 两 项 就 可 以 合并 来 消去 4: PA+PA=P, 卡 诺 图 将 这 些 可 以 合并 的 
项 放 在 相 邻 的 方 格 中 ， 使 它们 很 容易 被 看 到 。 

图 2-43 显示 一 个 3 输入 函数 的 真 值 表 和 卡 诺 图 。 卡 诺 图 的 最 上 一 行 给 出 了 输入 值 4、B 的 
4 种 可 能 值 。 最 左边 列 给 出 了 输入 值 C 的 2 种 可 能 值 。 卡 诺 图 中 的 每 一 个 方 格 与 真 值 表 一 行 中 
的 输出 值 了 相对 应 。 比 如 ， 左 上 角 的 方 格 与 真 值 表 中 的 第 一 行 相 对 应 ， 表 示 当 ABC =000 h, 
输出 Y=1。 与 真 值 表 的 每 一 行 一 样 ， 卡 诸 图 中 的 每 一 个 方 格 代表 了 一 个 最 小 项 。 图 2-43c 显示 
了 与 卡 诺 图 中 每 一 个 方 格 相 对 应 的 最 小 项 。 
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c ) 卡 诺 图 中 的 最 小 项 
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a) 真 值 表 
图 2-43 3 输入 函数 


每 一 个 方 格 ( 或 最 小 项 ) 与 相 邻 方 格 中 有 一 个 变量 的 值 不 同 。 这 意味 着 除了 一 个 变量 不 同 
外 相 邻 方 格 具 有 所 有 相同 的 变量 ， 这 个 变量 在 一 个 方 格 中 以 真 值 形式 出 现 ， 而 在 另 一 个 方 格 中 
以 取 反 形式 出 现 。 比 如 ， 代 表 最 小 项 4 B CHA BC 的 方 格 是 相 邻 的 ， 它 们 仅仅 是 变量 C 不 同 。 
你 可 能 已 经 注意 到 在 最 上 一 行 中 ,4 和 下 按照 特殊 的 顺序 组 合 : 00、01、11、10。 这 种 顺序 称 
为 格雷 码 。 它 与 普通 的 二 进 制 顺序 不 同 (00、01、10、11)， 因 为 在 相 邻 项 中 只 有 一 个 变量 不 
同 。 比 如 ， 在 格雷 码 中 01:11 仅仅 是 4 从 0 变化 为 1; 在 普通 的 二 进 制 顺序 中 01:10， 则 是 4 从 
0 变化 为 1 和 B 从 1 变化 为 0。 所 以 , 按照 普通 二 进 制 顺序 写 出 的 组 合 项 不 具有 相 邻 方 格 中 只 
有 一 个 变量 不 同 的 性 质 。 

卡 诺 图 也 是 “环绕 的 "。 最 右边 的 方 格 可 以 有 效 地 与 最 左边 的 方 格 相 邻 ， 因 为 它们 只 有 一 
个 变量 4 不同 。 换 句 话 说， 可 以 拿 起 图 将 其 卷 成 一 个 圆柱 体 ， 连 接 圆柱 体 的 末端 形成 一 个 圆 
环 ， 仍 然 保 证 相 邻 方 格 只 有 一 个 变量 不 同 。 


2.7.1 MAKERE 


在 图 2-43 的 卡 诺 图 中 ,仅仅 在 左边 出 现 了 2 个 为 1 的 最 小 项 4 BCRA BC。 从 卡 诺 图 中 读 
取 最 小 项 的 方法 完全 与 直接 从 真 值 表 读 与 或 式 的 方法 相同 。 

如 前 所 述 ， 我 们 用 布尔 代数 将 等 式 最 小 化 为 与 或 式 。 a 

Y=ABC+ABC =AB(C+C) =AB (2-7) 

卡 诺 图 有 助 于 通过 将 值 为 1 ROT ROR, 
地 实现 化 简 ， 如 图 2-44 所 示 。 对 于 每 一 个 圆圈 可 以 写 出 相应 N 
的 蕴涵 项 。2. 2 节 指 出 ， 一 个 蕴涵 项 是 由 一 个 或 者 多 个 变量 
产生 。 在 同一 个 圈 中 同时 包含 了 真 值 形式 和 取 仅 形式 的 蘑 个 
变量 可 以 从 蕴涵 项 中 删除 。 在 这 种 情况 下 ， 在 圈 中 的 变量 C 
同时 具有 真 值 形式 (1) 和 取 反 形式 (0)， 因 此 它 不 包含 在 蕴 
涵 项 中 。 换 句 话说 ， 当 4 = 有 =0 时 立 为 TRUE， 与 C 无关。 





.图 2-44 FARME 
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因此 蕴涵 项 为 4 B。 卡 诺 图 给 出 了 利用 布尔 代数 得 到 的 相同 结果 。 


2.7.2 卡 诺 图 化 简 逻 辑 


卡 诺 图 提供 了 一 种 简单 的 可 视 化 方式 来 化 简 馆 辑 。 用 尽 最 少 的 圈 来 轿 住 卡 诺 图 中 所 有 为 1 
的 方 格 。 每 一 个 圈 应 该 尽 可 能 地 大 。 然 后 读 取 每 个 圈 起 来 的 蕴涵 项 。 

更 加 正式 地 说 ， 当 布尔 表达 式 写成 最 少数 量 的 主 蕴涵 项 相 或 时 ， 布 尔 表达 式 得 到 最 小 化 。 
卡 诺 图 中 的 每 一 个 圈 代 表 一 个 蕴涵 项 。 最 大 的 圈 是 主 蕴 涵 项 。 

例如 ， 在 图 2-44 WEA, 4 B C 和 4 BC 是 蕴涵 项 ,但 不 是 主 蕴涵 项 。 在 该 卡 诺 图 中 ， 
只 有 4 B 是 主 蕴涵 项 。 从 卡 诺 图 得 到 最 小 化 等 式 的 规则 如 下 : 

。 用 最 少 的 圈 来 圈 住 全 部 所 有 的 1。 
每 个 圈 中 的 所 有 方 格 必须 都 包含 1。 
每 个 圈 必 须 是 矩形 ， 其 每 边 长 必须 是 2 的 整数 次 寡 ( 例 如 1、2 或 4)。 
每 个 圈 必 须 尽 可 能 地 大 。 
图 可 以 环绕 卡 诺 图 的 边界 。 
如 果 可 以 使 用 更 少数 量 的 圈 ， 则 卡 诺 图 中 一 个 为 1 的 方 格 可 以 被 多 次 圈 住 。 

用 卡 诺 图 化 简 3 变量 函数 

假设 有 一 个 函数 了 Y= F(4，B，C) ， 其 卡 诺 图 如 图 2-45 所 示 。 用 卡 诺 图 化 简 等 式 。 

解 : 用 尽 可 能 少 的 圈 来 圈 住 卡 诺 图 中 的 1， 如 图 2-46 所 示 。 卡 诺 图 中 的 每 个 圈 代 表 一 个 主 
蕴含 项 ， 每 个 圈 的 边 长 都 是 2 的 整数 次 宕 (2 x1 和 2 x2)。 可 以 通过 写 出 在 圈 中 只 出 现 真 值 形 
式 或 只 出 现 取 反 形式 的 变量 来 确定 每 个 圈 的 主 蕴含 项 。 





图 2-45 例 2.9 的 卡 诺 图 图 2-46 例 2.9 的 解 
例如 , 在 2xl WA, 的 真 值 形式 和 取 反 形式 包含 在 圈 中 ， 因 此 主 蕴 含 项 不 包含 B。 然 
mi, RA 4 的 真 值 形式 (4) 和 C 的 取 反 形式 (C) 在 这 个 圈 中 ， 所 以 可 以 得 出 主 蕴 含 项 4 C 中 的 
这 些 变量 。 同 样 ， 在 2 x2 的 图 中 圈 住 了 B=0 的 所 有 方 格 ， 于 是 主 蕴 含 项 为 B。 
注意 ， 为 了 使 主 蕴 含 项 圈 尽 可 能 地 大 ,右上 角 的 方 格 ( 最 小 项 ) 被 覆盖 了 两 次 。 与 布尔 代 
数 技 术 相 同 ， 这 等 效 于 共享 最 小 项 以 便 减少 蕴涵 项 的 大 小 。 同 样 需要 注意 的 是 ， 卡 诺 图 边 上 4 
个 方 格 的 圈 。 < 
GEED 7 段 数码 管 显示 译 码 器 
7 段 数码 管 显示 译 码 器 (seven-segment display decoder) 通 过 4 位 数据 的 输入 D, ,产生 7 位 输 
出 来 控制 发 光 二 极 管 显示 数字 0 ~9。 这 7 位 输出 一 般 称 为 段 a ~ Bag, 或 者 5, ~ $.， 如 图 2-47 
所 示 的 定义 。 这 些 数 字 的 显示 由 图 2-48 给 出 。 写 出 针对 输出 5, 和 5, 的 4 输入 真 值 表 ， 并 用 卡 
诺 图 化 简 布 尔 表达 式 。 假 设 非法 的 输入 值 (10 ~ 15 ) 不 产生 任何 显示 。 
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图 2-48 7 段 数码 管 显示 的 数字 


解 : 表 2-6 给 出 了 真 值 表 。 例 如 ， 输 入 0000 将 点 亮 除 8 .以 外 的 所 有 数码 管 。 
表 2-6 7 段 数码 管 显示 译 码 器 真 值 表 


Ds 5 S. S, S. S, Se S, 
0000 1 I I 1 1 I 0 
0001 0 l 1 0 0 0 0 
0010 1 | 0 1 1 0 l 
0011 1 1 | 1 0 0 1 
0100 0 | I 0 0 1 | 
0101 l 0 1 1 0 1 1 
0110 l 0 l 1 1 1 1 
0111 I ] 1 0 0 0 0 
1000 1 l 1 1 I | 1 
1001 1 1 1 0 0 1 1 
其 他 0 0 0 0 0 0 0 


这 7 个 输出 的 每 一 个 是 关于 4 个 变量 的 独立 函数 。 输 出 5, 和 5, 的 卡 诺 图 如 图 2-49 所 示 。 
注意 ， 行 和 列 都 按照 格雷 码 顺 序 排 列 : 00、01、11、10， 因 此 相 邻 方 格 中 只 有 一 个 变量 不 同 。 
在 方 格 中 写 输出 值 时 ， 必 须 注 意 记 住 这 个 顺序 。 

Sa 





图 2-49 7 段 数 码 管 显示 译 码 器 的 真 值 表 
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接着 ， 圈 住 主 蕴 含 项 。 用 最 少数 量 的 圈 来 圈 住 所 有 的 1。 一 个 圈 可 以 圈 住 边缘 (水 平方 向 
和 垂直 方向 ) ,一 个 1 可 以 被 圈 住 多 次 。 图 2-50 显示 主 蕴 含 项 和 化 简 的 布尔 表达 式 。 





S,= D,D,+D,D,+ D,D,D,+ D;D,Dy 
2-50 ”5, 和 5, 的 真 值 表 
注意 ， 主 蕴含 项 的 最 小 集合 不 是 唯一 的 。 比 如 , 在 5, 的 卡 诺 图 中 0000 项 可 以 沿 厦 1000 项 


巍 起 来 ， 以 便 产生 最 小 项 D,D,D,。 这 个 圈 也 可 以 用 0010 EE, 产生 最 小 项 D,D,D,， 如 图 2-51 
中 的 虚线 所 示 。 

图 2-52 描述 了 一 个 产生 非 主 蕴涵 项 的 常见 错误 : 用 一 个 单独 的 圈 来 圈 住 左上 和 角 的 1。 这 个 
最 小 项 是 有 ,D,D,D, ， 它 给 出 的 与 或 式 不 是 最 小 的 。 这 个 最 小 项 应 该 与 相 邻 的 较 大 圈 组 合 ， 如 
图 2-51 所 示 。 

图 2-51 产生 不 同 主 蕴含 项 集合 的 5, 的 另 一 种 卡 诺 图 





图 2-51 例 2.10 的 卡 诺 图 解 图 2-52 ”产生 非 主 蕴含 项 的 5, 的 男 一 种 卡 诺 图 马 
2.7.3 无 关 项 


2. 4 节 介绍 了 真 值 表 的 无 关 项 。 当 某 些 变量 对 输出 没有 影响 时 ， 可 以 减少 表 中 行 的 数量 。 
无 关 项 用 符号 X 表 示 ， 它 的 意思 是 输入 可 能 是 0 或 1。 
当 输 出 的 值 不 重要 或 者 相对 应 的 输入 组 合 从 不 出 现时 ,无关 项 也 会 出 现在 真 值 表 的 输出 
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中 。 由 设计 师 决定 这 些 输出 是 0 还 是 1。 

在 卡 诺 图 中 ， 无 关 项 可 以 进一步 帮助 化 简 逻 辑 。 如 果 可 以 用 较 少 或 较 大 的 圈 覆 盖 1， 则 这 
y 起 来 。 但 如 果 它 们 没有 帮助 ， 也 可 以 不 圈 起 来 。 

带 有 无 关 项 的 7 段 数码 管 显示 译 码 器 

er 10 ~15 产生 的 输出 ， 重 复 例 2. 10。 

解 : 卡 诺 图 如 图 2-53 所 示 ，X 表示 无 关 项 。 因 为 无 关 项 可 以 为 0 或 1， 所 以 如 果 它 允许 用 
较 少 或 较 大 的 圈 来 覆盖 1， 就 圈 住 这 些 无 关 项 。 认 为 圈 起 来 的 无 关 项 是 1， 而 没有 圈 起 来 的 无 
关 项 是 0。 注 意 $. 中 环绕 4 个 角 的 2 x2 方 格 。 利 用 无 关 项 可 以 很 好 地 化 简 逻 辑 式 。 








Hee 
S= D,+ D,D,+ D,D,+ D, S,= D,+D,D,+D,D, 


图 2-53 ”市 有 无 关 项 的 卡 诺 图 < 





27.4 “IN 


布尔 代数 和 卡 诺 图 是 两 种 逻辑 化 简 方 法 。 最 终 的 目标 都 是 找 出 开销 最 低 的 特定 逻辑 函数 实 
现 方法 。 

在 现代 工程 实践 中 ， 称 为 逻辑 综合 (logic synthesizer) 的 计算 机 程序 通过 逻辑 函数 的 描述 来 
产生 化 简 电 路 ， 这 将 在 第 4 章 中 介绍 。 对 于 大 问题 ， 逻 辑 综合 比 人 工 方法 更 高 效 。 对 于 小 问 
题 ， 有 经 验 的 设计 者 可 以 通过 观察 的 方法 来 找 出 好 的 解决 方案 。 作 者 在 现实 工作 中 没有 使 用 卡 
诸 图 来 解决 实际 问题 。 但 是 通过 卡 庄 图 获得 的 洞察 力 很 有 价值 ， 并 且 卡 诺 图 也 经 党 出 现在 工作 
面试 中 。 


2.8 组合 逻辑 模块 

组 合 逻 辑 电路 经 常 组 成 一 个 更 大 的 模块 来 实现 更 复杂 的 系统 。 这 是 抽象 原理 的 一 个 应 用 ， 
隐藏 不 重要 的 门 级 细节 ， 把 重点 放 在 模块 的 功能 上 。 我 们 已 经 学 习 了 3 种 组 合 逻辑 模块 : 全 加 
an (2.1 节 )、 优 先 级 电路 (2.4 节 ) 和 7 段 译 码 显示 器 (2.7 节 )。 在 这 一 节 ， 我们 将 介绍 两 种 更 
常用 的 组 合 逻 辑 模块 : 复 用 器 和 译 码 器 。 第 5 章 将 介绍 其 他 的 组 合 逻 辑 模块 。 


2.8.1 SRA 


复 用 器 (multiplexer) 是 一 种 最 常用 的 组 合 逻辑 电路 。 根 据 选 择 ( select) 信号 的 值 它 从 多 个 可 
能 的 输入 中 选择 一 个 作为 输出 。 复 用 器 有 时 简称 为 mux。 

1. 2:1 复 用 器 

图 2-54 给 出 了 2:1 复 用 右 的 原理 图 和 真 值 表 , 它 有 2 个 输入 D, 和 D,， 一 个 选择 输入 S 和 
一 个 输出 Y。 复 用 器 根据 选择 信号 的 值 在 2 个 输入 数据 中 选择 一 个 数据 输出 : 如 果 S=0， 则 
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z] Y=D,; 如 果 S$=1,， 则 了 = D,。5S 也 称 为 控制 信号 (control signal) ， 因 为 它 控制 复 用 器 如 何 

! | 操作 。 

= 一 个 2:1 复 用 器 可 以 用 与 或 逻辑 实现 ， 如 图 2-55 所 示 。 复 用 器 的 布尔 等 式 可 以 通过 卡 诺 图 
或 者 通过 分 析 得 到 (如 果 S=1 且 D,=1 或 者 $=0 且 D,=1, 则 Y=1)。 
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图 2-54 2:1 AAPA TTS ARIAK 图 2-55 使 用 两 级 逻辑 实现 2:1 RHA 


复 用 器 也 可 以 由 三 态 缓冲 器 构成 ， 如 图 2-56 所 示 。 安 排 三 态 缓冲 器 使 能 信号 有 效 使 得 在 
任何 时 刻 仅 有 一 个 三 态 缓冲 器 有 效 。 当 $ =0 时 ， 三 态 缓冲 器 TO 有 效 ， 人 允许 六 输出 到 了; 当 
S=1 时 ， 三 态 缓冲 器 TI 有效， 允许 D, 输 出 到 了 Y。 

2. BRWS Ae 

一 个 4:1 复 用 器 有 4 个 数据 输入 和 1 个 输出 ， 如 图 2-57 所 示 。 需 要 2 个 选择 信号 在 4 个 输 
入 数据 中 选择 。4:1 复 用 器 可 以 使 用 与 或 式 逻 辑 构成 ， 也 可 以 使 用 三 态 缓冲 器 或 多 个 2:1 复 用 
器 构成 ， 如 图 2-58 所 示 。 


D, T0 
ii x, 
y a 5 
D, 0 IC 
TO Fe x Y 
Y=D,S+D,S D, 
图 2-56 使 用 三 态 缓冲 器 实现 2:1 复 用 器 图 2-57 4:1 AHAS 


三 态 缓冲 器 的 使 能 项 可 以 用 与 门 和 非 门 组 成 ， 也 可 以 用 2. 8. 2 节 介 绍 的 译 码 需 组 成 。 

8:1 和 16:1 等 更 宽 的 复 用 器 可 以 如 图 2-58 所 示 的 扩展 方法 构造 。 总 之 , 一 个 :1 复 用 器 
mlog N 条 选择 线 。 男 外 ， 好 的 实现 选择 还 取决 于 具体 的 实现 技术 。 

3. 复 用 器 逻辑 

复 用 器 可 以 用 查找 表 ( lookup table) 的 方式 实现 逻辑 功能 。 图 2-59 显示 了 一 个 用 4:1 RHA 
实现 的 2 输入 与 门 。 输 入 4 和 B 作为 选择 信号 。 复 用 右 的 数据 输入 根据 真 值 表 中 相应 行 相连 接 
到 0 或 1。 总 之 , 一 个 2 个 输入 的 复 用 器 可 以 通过 将 合适 的 输入 连接 到 0 或 者 1 的 方法 来 实现 
任何 N 输入 逻辑 函数 。 此 外 ， 通 过 改变 数据 输入 ， 复 用 器 可 以 重新 编程 来 实现 其 他 功能 。 


i O a a 





a) 两 级 逻辑 b) 三 态 绥 冲 器 c) 层次 结构 
图 2-58 4:1 复 用 器 的 实现 


我 们 能 够 将 复 用 器 的 大 小 减少 一 半 ， 只 使 用 一 个 2 输入 复 用 
器 来 实现 任何 入 输入 逻辑 函数 。 方 法 是 将 一 个 变量 ,以 及 0 和 
1 作为 复 用 器 的 数据 输入 。 

图 2-60 进一步 说 明 这 个 原理 。 该 图 用 2:1 复 用 器 分 别 实现 
了 2 输入 与 函数 和 异 或 函数 。 从 一 个 普通 真 值 表 开 始 ， 然 后 组 
合 多 对 行 来 消除 用 该 变量 的 输出 表示 的 最 右边 的 变量 。 比 如 ， 
在 与 门 的 情况 下 ， 当 4 =0 时 , AE BBA, Y=0, 4A=1 
Ht, WR B=0, MW Y=0; 如 果 B=1， 则 了 =1， 于 是 可 以 得 到 
Y=B, 根据 这 个 更 小 的 、 新 的 真 值 表 ,可 以 将 复 用 器 作为 一 个 
查找 表 来 使 用 。 





图 2-59 用 一 个 4:1 复 用 器 实现 
2 输入 与 门 





图 2-60 使 用 可 变 输入 的 复 用 器 逻辑 


使 用 复 用 器 实现 的 逻辑 

Alyssa P. Hacker PE SC Hil pe BY Y= A B+BC+ABC 
来 完成 她 的 毕业 设计 。 但 是 ， 当 她 查看 实验 工具 箱 ， 发 
现 只 剩 下 一 个 8:1 复 用 器 。 她 如 何 实现 这 个 函数 ? 

解 : 如 图 2-61 所 示 ，Alyssa 使 用 一 个 8:1 复 用 器 来 
实现 。 复 用 器 充当 查找 表 ， 其 中 真 值 表 中 的 每 一 行 与 复 
用 瘟 的 一 个 输入 相对 应 。 < 

Bi) 2. 13 再 次 使 用 复 用 器 实现 的 逻辑 oe BC+ UBC 


在 期 末 报 告 前 ，Alyssa 打开 电路 的 电源 ， 结 果 将 8:1 a) 真 值 表 b ) 复 用 器 实现 
复 用 器 烧 坏 了 (由 于 昨天 整 晚 没 有 休息 ， 她 意外 地 用 20V 图 2-61 Alyssa 的 电路 
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BERE SV 电压 供电 ) 。 她 请 求 她 的 朋友 将 余下 的 元 器 件 给 她 。 他 们 给 她 一 个 4:1 复 用 器 和 一 
个 非 门 。 她 如 何 只 用 这 些 部 件 来 构造 新 的 电路 ? 

fe: 通过 让 输出 取决 于 C, Alyssa 将 真 值 表 减 少 到 4 行 (她 也 尝试 过 重新 排列 真 值 表 的 列 ， 
使 输出 取决 于 4 和 B)。 图 2-62 给 出 了 新 的 设计 。 4 





2-62 Alyssa 的 新 电路 


2.8.2 译 码 器 


译 码 器 用 个 输入 和 2 个 输出 。 它 的 每 一 个 输出 都 取决 于 
输入 的 组 合 。 图 2-63 给 出 了 一 个 2:4 译 码 器 。 当 A =00 时 = 
1, Ao =01 WY, =1 等 。 输出 称 为 独 热 (one-hot)， 因 为 在 给 
定时 间 恰 好 只 有 一 个 输出 为 高 电 平 。 

译 码 器 的 实现 

用 与 门 、 或 门 和 非 门 实现 一 个 2:4 译 码 器 。 

解 : 使 用 4 个 与 门 来 实现 2:4 译 码 器 的 电路 如 图 2-64 所 示 。 
每 个 门 依 赖 于 所 有 输入 的 真 值 形式 或 取 反 形式 。 总 之 ， 一 个 N:2” 
的 译 码 器 可 以 由 2 个 入 输入 与 门 通过 接收 所 有 输入 的 值 形式 或 取 反 形式 的 各 种 组 合 来 构成 。 
译 码 副 的 每 一 个 输出 代表 一 个 最 小 项 。 比 如 ， 六 代表 最 小 项 4,4,。。 当 与 其 他 数字 模块 一 同 使 用 
时 这 会 很 方便 。 < 


A, Ay 





图 2-63 2:4 FFIBR 


Yo 


图 2-64 2:4 译 码 器 的 实现 
PER Ae ee at 
译 码 器 可 以 和 或 门 组 合 来 实现 逻辑 函数 。 图 2-65 显示 了 用 一 个 2:4 译 码 器 和 一 个 或 门 
来 实现 的 一 个 2 输入 XNOR FRIE) 图 数 。 因 为 译 码 器 的 每 一 个 输出 都 代表 一 个 最 小 项 ， 
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所 以 函数 将 以 所 有 最 小 项 的 或 来 实现 。 在 图 2-65 fh, Y=AB+AB=AQ@B, 

当 使 用 译 码 器 来 构造 逻辑 电路 时 ， 很 容易 将 函数 表示 
成 真 值 表 或 者 标准 的 与 或 式 。 一 个 在 真 值 表 中 包含 W 个 1 
的 N 输 入 函数 ， 可 以 通过 一 个 N:2* 译 码 器 和 只 输入 或 门 
来 实现 。 在 5.5.6 节 中 ， 这 个 概念 将 应 用 到 只 读 存储 器 
(ROM) 中。 


2.9 WF 


在 前 面 的 章节 中 ， 我 们 主要 关心 在 使 用 最 少 门 的 理想 状 i 
态 下 电路 是 否 工作 。 但 是 ， 任 何 经 验 丰富 的 电路 设计 师 都 认 7S ERREEN 
为 电路 设计 中 最 具有 挑战 性 的 问题 是 时 序 (timing): 如 何 使 
电路 运行 得 最 快 。 

输出 响应 输入 的 改变 而 改变 需要 一 定 的 时 间 。 图 2-66 
显示 了 缓冲 器 的 一 个 输入 改变 和 随后 输出 改变 所 产生 的 延 
迟 。 这 个 图 称 为 时 序 图 (timing diagram) ， 它 描绘 了 当 输 入 改 
恋 时 缓冲 器 电路 的 瞬间 响应 (transient response)。 从 低 电 平 
LOW 到 高 电 平 HIGH 的 转变 称 为 上 升 洛 。 同 样 ; 从 高 电 平 。 
HIGH 到 低 电 平 LOW 的 转变 称 为 下 降 洛 (在 图 中 没有 显示 ) 。 
灰色 箭头 表示 了 的 上 升 沿 由 4 的 上 升 沿 引起 。 在 输入 信和 号 4 图 2-66 ”电路 延迟 
的 50% 点 到 输出 信号 了 的 50% 点 之 间 测 量 延 迟 。50% 点 是 信号 在 转变 过 程 中 电压 处 于 高 电 平 
和 低 电 平 之 间 中 间 点 的 位 置 。 


2.9.1 传播 延迟 和 最 小 延迟 


组 合 逻 辑 电 路 的 时 序 特征 包括 传播 延迟 (propagation delay ) 和 最 小 延迟 (contamination de- 
lay) 。 传 播 延 迟 志 是 当 输入 改变 直到 一 个 或 多 个 输出 达到 它 
们 的 最 终 值 所 经 历 的 最 长 时 间 。 最 小 延迟 如 是 当 一 个 输入 发 
生变 化 直到 任何 一 个 输出 开始 改变 的 最 短 时 间 。 

图 2-67 分 别 显 示 了 一 个 缓冲 妖 的 传播 延迟 和 最 小 延 返 。 
图 中 显示 了 在 特定 时 间 内 4 的 初 值 是 高 电 平 HIGH 或 者 低 电 
平 LOW， 并 变化 为 男 一 个 状态 。 我 们 只 对 值 的 改变 过 程 感 兴 
趣 ， 而 不 用 关心 值 是 多 少 。 在 稍 后 时 间 了 将 对 4 的 变化 做 出 
响应 ， 并 产生 变化 。 这 些 弧 形 表示 在 A 发 生 转 变 局 时 间 后 ， ei ae a 
7 开始 改变 ; 在 如 时 间 后 , 了 的 新 值 稳定 下 来 。 时 间 

电路 产生 延迟 的 基本 原因 包括 : 电路 中 电容 充电 所 需要 ”图 2.67 传播 延迟 和 最 小 延迟 
的 时 间 和 光速 。 因 为 很 多 原因 ，t, 和 i 的 值 可 能 不 同 ， 
包括 : 

e 不 同 的 上 升 和 下 降 延 迟 。 

© 多 个 输入 和 输出 之 间 的 延迟 可 能 不 同 。 

。 当 电 路 较 热 时 速度 会 变 慢 ， 较 冷 时 会 变 快 。 

计算 上 和 霹 需 要 更 低 抽 象 级 的 知识 ， 它 超出 了 本 书 的 范围 。 但 是 芯片 制造 商 通常 提供 数 
据 手册 来 说 明 每 个 门 的 延迟 。 

根据 已 经 列举 出 的 各 种 因素 ， 传 播 延迟 和 最 小 延迟 也 可 以 由 一 个 信号 从 输入 到 输出 的 路 径 
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来 确定 。 图 2-68 给 出 了 一 个 4 输入 逻辑 电路 。 用 加 粗 黑 色 表示 的 关键 路 径 ( critical path) 是 从 4 


或 B 到 输出 Y。 因 为 通过 3 个 门 才 将 输入 传输 到 输出 ， 
所 以 它 是 一 条 最 长 的 路 径 ， 也 是 最 慢 的 路 径 。 这 条 路 径 
是 关键 路 径 ， 因 为 它 限制 了 电路 运行 的 速度 。 用 灰色 显 
示 的 通过 电路 的 最 短路 径 (short path) 是 从 输入 D 到 输出 
Y。 因 为 输入 通过 1 个 门 就 传输 到 输出 ， 所 以 此 路 径 是 最 
短路 径 ， 也 是 通过 电路 的 最 快 路 径 。 

组 合 电路 的 传播 延迟 是 关键 路 径 上 每 一 个 元 件 的 传 
播 延迟 之 和 。 最 小 延迟 是 最 短路 径 上 每 个 元 件 的 最 小 延 
述 之 和 。 这 些 延 迟 如 图 2-69 所 示 ， 也 可 由 下 式 描述 : 


tig = 2t i AND + pd OR 


bog = bog AND 


关键 路 径 
A =1>0 nl 
B=] m 
C=0 
Y=1>0 
最 短路 径 
A=1 nl 
B=! n2 
C=0 
D=i>0 ER re 


延迟 计算 


关键 路 径 


nl 


5 A wa 


最 短路 径 
图 2-68 最短 路径 和 关键 路 径 


(2-8) 
(2-9) 








时 间 
2-69 ”关键 路 径 和 最 短路 径 的 波形 


Ben 需要 计算 图 2-70 中 的 传播 延迟 和 最 小 延迟 。 根 据 他 的 数据 手册 .， 每 个 门 的 传播 延迟 和 


最 小 延迟 分 别 为 100ps 和 60ps。 


解 : Ben 首先 确定 电路 中 的 关键 路 径 和 最 短路 径 。 关 键 路 径 是 从 输入 4 或 B 通 过 3 个 门 到 
达 输 出 Y， 在 图 2-71 中 用 高 亮 的 黑色 标 出 。 所 以 ,i 是 单个 门 传播 延迟 的 3 售 ， 即 300ps。 
最 短路 径 是 从 输入 C、D 或 E 通 过 2 个 门 到 达 输 出 Y， 在 图 2-72 中 用 灰色 标 出 。 在 最 短路 


上 有 2 个 门 ， 所 以 t 是 120ps。 


Be 


径 
4 
B 
Cc 
D 
E 


md A wes 


< 


met 
md OA Br 
na 


2-70 Ben 的 电路 , 图 2-71 Ben 的 关键 路 径 2-72 Ben 的 最 短路 径 
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复 用 器 的 时 序 : 控制 关键 路 径 与 数据 关键 路 径 
比较 2. 8. 1 节 中 图 2-58 所 示 的 3 种 4 输入 复 用 器 的 最 坏 情况 时 序 。 表 2-7 列 出 了 元 件 的 传 
播 延迟 。 每 一 种 设计 的 关键 路 径 是 什么 ? 选择 一 个 你 认为 32-7 复 用 器 电路 元 件 的 时 序 规范 


好 的 设计 ， 并 给 出 时 序 分 析 。 门 toa (ps) 
解 : 如 图 2-73 和 图 2-74 所 示 , 3 种 设计 方法 的 关键 NT 3 
路 径 都 用 高 亮 黑 色 标 出 。t,。 ,表示 从 输入 5 到 输出 了 的 传 ”2 输入 AND 60 
播 延迟 ; 4, 表示 从 输入 DD 到 输出 了 的 传播 延迟 ; ts 是 这 ”3 输入 AND 80 
两 个 延迟 的 最 坏 情 况 ， 即 max(ta yo bya ay) o 4 输入 OR 90 
2-73 中 的 两 个 设计 都 用 二 级 逻辑 电路 和 三 态 缓冲 et ribet oe on: : 
器 实现 。 关 键 路 径 都 是 从 控制 信号 S 到 输出 信号 Y: u 一 一 


toa wo 因为 关键 路 径 是 从 控制 信号 到 输出 ， 所 以 这 些 电 路 

是 控制 关键 (control critical)。 控 制 信号 中 的 任何 附加 延迟 都 将 直接 增加 到 最 坏 情 况 下 的 延迟 。 

在 图 2-73b 中 从 九 到 了 的 延迟 只 有 50ps， 而 从 S$ 到 了 的 延迟 有 125ps。 
& g Si So 





boa sy = Tpd INV + 1pd AND3 + fpa OR4 thd sy= tpd Nv t Spa AND2 + tpa_ TRI sy 
= 30ps + 80ps + 90ps =30ps + 60ps + 35ps 
= 200ps =125ps 
toa dy = {pd_AND3 + fpd OR4 boa dy = fa TRI ay 
= 170ps = 50ps 
a) AKRI b) 三 态 缓冲 器 


图 2-73 4:1 复 用 器 传播 延迟 


图 2-74 显示 了 用 两 级 2:1 复 用 器 分 层 实现 的 一 个 4:1 
复 用 器 。 关 键 路 径 是 从 任意 DD 输入 到 输出 。 因 为 该 关键 路 
径 是 从 数据 输出 到 输出 (ta =taw)， 所 以 该 电路 是 数据 关 
键 (data critical ) 。 

如 果 数 据 输入 在 控制 输入 前 到 达 ， 则 我 们 倾向 于 具有 
最 短 控制 -输出 延迟 的 设计 (如 图 2-74 所 示 的 分 层 设计 )。 
同样 ， 如 果 控 制 信号 在 数据 信号 之 前 到 达 ， 则 我 们 选择 具 
有 最 短 数据 - 输出 延迟 的 设计 (如 图 2-73b 所 示 的 三 态 缓冲 
器 设计 )。 fod s0y = fpa TRLSY + td TRLAY = 8Sns 

最 好 的 设计 选择 不 仅 取 决 于 通过 电路 的 关键 路 径 和 fn ay = Zipa ri ay = 100ns 
输入 到 达 时 间 ， 而 且 还 取决 于 功 耗 、 成 本 、 部 件 可 用 图 2-74 4:1 复 用 器 传播 延迟 : 使 用 
性 等 。 < 2:1 复 用 器 分 层次 实现 
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2.9.2 毛刺 

到 目前 为 止 ， 我 们 已 经 讨论 了 一 个 输入 信号 的 改变 导致 一 个 输出 信号 改变 的 情况 。 但 是 ， 
一 个 输入 信号 的 改变 可 能 会 导致 多 个 输出 信号 的 改变 。 这 称 为 毛刺 (glitch) 或 者 冒险 (hazard)。 
虽然 毛刺 通常 不 会 导致 什么 问题 ,但 是 了 解 它们 的 存在 和 在 时 序 图 中 识别 它们 也 是 很 重要 的 。 
图 2-75 显示 了 一 个 产生 毛刺 的 电路 的 卡 诺 图 。 





图 2-75 带 有 毛刺 的 电路 


布尔 表达 式 的 最 小 化 是 正确 的 ， 考 察 图 2-76 关键 路 径 
H, 4A=0, C=1, B 从 1 变 成 0 时 ， 将 发 生 什 本 
么 情况 。 最 短路 径 ( 用 灰色 显示 ) 通 过 与 门 和 或 
门 2 个 门 。 关 键 路 径 ( 用 黑色 显示 ) 通 过 了 一 个 
逆 度 器 和 两 个 门 ( 与 门 和 或 门 ) 。 

4 BA 1 变 成 0 时 ，n2( 在 最 短路 径 上 ) 在 
nl ( 在 关键 路 径 上 ) 上 升 前 下 降 。 直 到 nl EF, 
到 或 门 的 2 个 输入 都 是 0， 输 出 了 下 降 到 0。 最 
后 当 nl EF, YORAM 1, RA in 
图 2-76 所 示 , Y 的 值 从 1 开始 ， 结 束 时 也 为 1， 
但 是 存在 暂时 为 0 的 毛刺 。 

在 读 取 输 出 前 只 要 等 待 传播 延迟 消逝 ， 毛 
刺 不 是 问题 ， 因 为 输出 最 终 将 稳定 在 正确 的 值 。 

可 以 在 已 有 实现 中 增加 其 他 的 门 电 路 来 避 
免 毛 刺 。 这 从 卡 诺 图 中 最 容易 理解 。 图 2-77 显 
示 了 从 ABC =001 变 成 4BC =011 在 8 上 的 输入 改变 ， 从 一 个 主 蕴涵 项 圈 移 到 另 一 个 。 这 个 变 
化 穿 过 了 卡 诺 图 中 两 个 主 蕴 涵 项 的 边界 ， 从 而 可 能 产生 毛刺 。 

从 图 2-76 中 的 时 序 图 可 以 看 出 ， 在 男 一 个 主 蕴 涵 项 的 电路 开启 前 ， 如 果 主 蕴涵 项 的 电路 
将 关闭 ， 就 会 产生 毛刺 。 为 了 去 除 毛刺 ， 可 以 增加 一 个 新 的 覆盖 主 蕴 涵 项 边缘 的 圈 ， 如 图 2-78 
所 示 。 根 据 一 致 性 定理 ， 新 增加 的 项 4C 是 一 致 项 或 多 余 项 。 





图 2-76 毛刺 的 时 序 





Gang 
Pau 

Y=AB+BC \ AC Y=AB+BC+AC 
图 2-77 输入 的 改变 穿越 了 蕴含 项 的 边界 图 2-78 无 毛刺 的 卡 诺 图 
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图 2-79 是 一 个 防止 毛刺 出 现 的 电路 ， 它 增加 了 一 个 用 灰色 高 亮 显示 的 与 门 。 现 在 ， 当 4 = 
0 和 C=1 时 ， 即 使 B 变化 也 不 会 造成 输出 上 的 毛刺 ， 因 为 在 整个 变化 过 程 中 新 增加 的 与 门 始 
终 输 出 为 1。 

总 之 ， 当 信号 的 变化 在 卡 诺 图 中 穿越 2 NEA 。 /4-0 
涵 项 的 边缘 时 就 会 出 现 毛 刺 。 能 够 通过 在 卡 诺 图 中 2510 
增加 多 余 的 蕴涵 项 来 盖 住 这 些 边 缘 以 避免 毛刺 。 当 
然 这 以 增加 额外 的 硬件 成 本 为 代价 。 pe 

然而 ， 多 个 输入 上 的 同时 变化 也 会 导致 毛刺 。 
这 些 毛刺 不 能 通过 增加 硬件 来 避免 。 因 为 大 多 数 系 
统 都 会 有 多 个 输入 上 的 同时 (或 者 几乎 同时 ) 变化 ， 图 2-79 无 毛刺 的 电路 
所 以 毛刺 在 大 多 数 电路 中 都 存在 。 虽 然 我 们 已 经 介绍 了 一 种 避免 毛刺 的 方法 ， 但 讨论 毛刺 的 关 
键 不 在 于 如 何 取 去 除 它们 ， 而 是 要 意识 到 毛刺 的 存在 。 在 示波器 和 仿真 器 上 观看 时 序 图 时 这 一 
点 非常 重要 。 


2.10 总结 


数字 电路 是 一 个 市 离散 值 输 入 和 输出 的 模块 。 它 的 规范 描述 了 模块 实现 的 功能 和 时 序 。 本 
草 将 重点 放 在 组 合 电 路 上 ， 其 输出 仅仅 取决 于 当前 的 输入 值 。 

组 合 电路 的 功能 可 以 通过 真 值 表 或 布尔 表达 式 给 出 。 每 个 真 值 表 的 布尔 表达 式 可 以 通过 系 
统 地 使 用 与 或 式 或 者 或 与 式 获 得 。 在 与 或 式 中 ,布尔 表达 式 写成 一 个 或 多 个 蕴涵 项 的 或 (OR )。 
蕴涵 项 是 各 个 变量 的 与 (AND) 。 变 量 是 输入 量 的 真 值 形式 或 取 反 形式 。 

可 以 使 用 布尔 代数 中 的 规则 化 简 布 尔 表达 式 。 特 别 是 ， 可 以 通过 组 合 包含 某 个 变量 的 真 值 
形式 或 取 反 形式 的 两 个 蕴涵 项 来 化 简 为 最 简 的 与 或 式 : PA + P =P。 卡 诺 图 是 化 简 最 多 包含 4 
个 变量 函数 的 图 形 化 方法 。 通 过 训练 ， 设 计 师 总 是 能 够 将 布尔 表达 式 化 简 为 只 包含 最 少 变 量 的 
形式 。 计 算 机 辅助 设计 工具 也 和 常用 于 处 理 更 加 复杂 的 函数 ,我 们 将 在 第 4 章 中 介绍 更 多 的 这 类 
方法 和 工具 。 

连接 人 逻辑 门 来 构造 组 合 电 路 ， 实 现 所 希望 的 功能 。 任 何 与 或 式 的 表达 式 都 可 以 通过 两 级 逻 
辑 实现 : 非 门 实现 输入 的 取 反 、 与 门 实现 变量 的 与 、 或 门 实现 变量 的 或 。 根 据 不 同 的 功能 和 可 
用 的 模块 变量 ， 以 各 种 类 型 的 门 为 基础 的 多 级 逻辑 实现 会 更 高 效 。 例 如 ，CMOS 电路 更 偏爱 与 
非 门 和 或 非 门 ， 因 为 这 些 门 可 以 直接 用 CMOS 晶体 管 来 实现 而 不 需要 额外 的 非 门 。 当 使 用 与 非 
门 和 或 非 门 时 ， 推 气泡 法 有 助 于 跟踪 取 反 过 程 。 

逻辑 门 可 以 组 合 在 一 起 构造 更 大 规模 的 电路 ， 如 复 用 器 、 解 码 器 和 优先 级 电路 等 。 复 用 器 
根据 选择 输入 来 选择 一 个 输入 数据 。 译 码 器 根据 输入 将 多 个 输出 中 的 一 个 设置 为 高 电 平 。 优 先 
级 电路 产生 表示 最 高 优先 级 输入 的 输出 。 这 些 电路 都 是 组 合 电路 模块 的 例子 。 第 5 章 将 介绍 更 
多 的 组 合 逻辑 模块 ， 包 括 其 他 的 算术 电路 。 这 些 模块 将 在 第 7 章 中 得 到 广泛 的 运用 。 

组 合 电路 的 时 序 包含 电路 的 传播 延迟 和 最 小 延迟 ， 它 们 说 明 输 入 改变 和 随后 的 输出 改变 之 
间 的 最 长 和 最 短 时 间 。 计 算 电 路 的 传播 延迟 需要 首先 确定 电路 中 的 关键 路 径 ， 然 后 将 该 路 径 上 
每 一 个 元 件 的 传播 延迟 相 加 。 实 现 复 杂 的 组 合 逻 辑 电 路 有 很 多 方式 ， 这 些 方 式 在 速度 和 成 本 上 
各 有 侧重 。 

第 3 划 介 绍 时 序 电路 ， 它 的 输出 取决 于 先前 的 输入 和 当前 的 输入 。 换 句 话说 ， 时 序 电路 对 
过 去 的 状态 有 记忆 。 


习题 
2.1 与 出 图 2-80 中 每 个 真 值 表 的 与 或 式 的 布尔 表达 式 。 
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e) 


d) 
图 2-80 习题 2. 1 和 习题 2. 3 的 真 值 表 


每 个 真 值 表 的 与 或 式 的 布尔 表达 式 。 


c) 


b) 


a) 


2.2 写 出 图 2-81 中 
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e) 


d) 


c) 


习题 2. 2 和 习题 2. 4 的 真 值 表 


2.3 写 出 图 2-80 中 每 个 真 值 表 的 或 与 式 的 布尔 表达 式 。 
2.4 写 出 图 2-81 中 每 个 真 值 表 的 或 与 式 的 布尔 表达 式 。 


2.5 最 小 化 习题 2. 1 中 的 布尔 表达 式 。 
2.6 最 小 化 习题 2. 2 中 的 布尔 表达 式 。 


b ) 


a) 


图 2-81 


个 相对 简单 的 组 合 电路 来 实现 习题 2.5 中 的 每 一 个 函数 。 相 对 简单 表示 不 要 浪费 逻 


辑 门 ， 但 也 不 要 浪费 大 量 的 时 间 来 检验 每 一 种 可 能 的 实现 电路 。 


加 一 


2.7 


个 相对 简单 的 组 合 电路 来 实现 习题 2.6 中 的 每 一 个 函数 。 


只 使 用 非 门 、 与 门 和 或 门 来 重 做 习题 2. 7。 


|] 一 


2.8 


2.9 


O 


习题 2.8 


或 门 来 重 做 
与 非 门 和 或 非 门 来 重 做 习题 2.7。 


与 门 和 


a 


只 使 用 非 门 


2. 10 
2: 11 


2.12 


只 使 用 非 门 、 


与 非 门 和 或 非 门 来 重 做 习题 2. 8。 
2. 13 ”使 用 布尔 定理 来 化 简 下 列 布尔 表达 式 。 用 真 值 表 或 卡 诺 图 来 检验 其 正确 性 。 


只 使 用 非 门 、 
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(a) Y=AC+A BC 


(b) Y=AB+ABC+(A +C) 
(c) Y=ABCD+ABC+ABCD+ABD+ABCD+BCD+A 
使 用 布尔 定理 来 化 简 下 列 布尔 表达 式 。 用 真 值 表 或 卡 诺 图 来 检验 其 正确 性 。 


(a) Y=ABC+ABC 
(b) Y=ABC+AB 


(c) Y=ABCD+ABCD+ (A+B+C+D) 
画 一 个 相对 合理 的 组 合 电 路 来 实现 习题 2. 13 中 的 每 一 个 函数 。 
画 一 个 相对 合理 的 组 合 电 路 来 实现 习题 2. 14 中 的 每 一 个 函数 。 


17 ”化 简 下 列 布尔 表达 式 ， 画 一 个 相对 简单 的 组 合 电路 来 实现 化 简 后 的 等 式 。 
(a) Y=>=BC+ABC+BC 
(b) ¥=A +AB+AB+A+B 
.18 化 简 下 列 布尔 表达 式 ， 画 一 个 相对 简单 的 组 合 电路 来 实现 化 简 后 的 等 式 。 
(a) Y=ABC+BC+BC 
(b) Y=(A+B+C)D+AD+B 
(c) Y=ABCD +AB CD + (B +D)E 
.19 给 出 一 个 行 数 在 30 ~50 亿 之 间 的 真 值 表 ， 而 此 真 值 表 可 以 用 少 于 40 个 (至 少 1 个 ) 的 2 
输入 门 来 实现 。 
.20 给 出 一 个 带 有 环 路 但 仍然 是 组 合 电路 的 例子 。 
.21 AlyssaP. Hacker 说 任何 布尔 肾 数 都 可 以 写成 作为 函数 所 有 主 蕴涵 项 或 的 最 小 与 或 式 。 
Ben 说 存在 一 些 函 数 ， 它 们 的 最 小 等 式 不 包含 所 有 的 主 蕴 涵 项 。 解 释 为 什么 Alyssa 是 正 
确 的 或 者 提供 一 个 反例 来 证 明 Ben 的 观点 。 
.22 使 用 完全 归纳 法 证 明 下 列 定理 。 不 需要 证 明 它 们 的 对 偶 式 。 
(a) 重合 定理 (T3) (b) 分 配 定理 (T8) (c) 合并 定理 (T10) 
. 23 ”使 用 完全 归纳 法 证 明 3 个 变量 (8,、B,、B,) 的 德 * 摩根 定理 (T12)。 
.24 写 出 图 2-82 电路 中 的 布尔 表达 式 。 不 必 最 小 化 表达 式 。 
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图 2-82 电路 原理 图 
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2.25 
2. 26 


2. E 


2. 32 
2. 33 


2. 34 


2# 


最 小 化 习题 2. 24 中 的 布尔 表达 式 ， 画 出 一 个 具有 相同 功能 的 改进 电路 。 
使 用 德 * 摩根 定理 等 效 门 和 推 气泡 方法 ,重新 画 出 4 
图 2-83 中 的 电路 ， 这 样 通过 观察 可 以 写 出 布尔 表达 式 。 CF 
写 出 布尔 表达 式 。 
对 于 图 2-84 中 的 电路 ， 重 复习 题 2. 26 中 的 练习 。 E 


A 图 2-83 电路 原理 图 


So 


QO 


图 2-84 电路 原理 图 


写 出 图 2-85 中 函数 的 最 小 布尔 表达 式 ， 记 得 要 利用 无 关 项 。 

画 出 习题 2. 28 中 函数 所 对 应 的 电路 图 。 

当 一 个 输入 改变 时 ,习题 2. 29 中 的 电路 有 一 些 潜在 的 毛刺 码 ? 如 果 没 有 ， 解 释 为 什么 
没有 。 如 果 有 ， 写 出 如 何 修改 电路 来 消除 这 些 毛 刺 。 

写 出 图 2-86 中 函数 的 最 小 布尔 表达 式 ， 记 得 要 利用 无 关 项 。 
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2-85 ”习题 2. 28 HAH 图 2-86 习题 2.31 的 真 值 表 


画 出 习题 2. 31 中 函数 所 对 应 的 电路 图 。 

Ben 将 在 没有 蚂蚁 的 畏 天 去 野 炊 。 如 果 他 看 到 蜂鸟 ， 即 使 野 炊 的 地 方 有 蚂蚁 和 球 虫 ， 他 
EZERK, REARS). H(A), S (H) 和 球 虫 () ， 写 出 他 去 野 炊 (五 ) 的 布尔 
表达 式 。 

完成 7 BPE ae AI Be 5. 到 $, 的 设计 (参考 例 2. 10) : 

(a) 假设 输入 大 于 9 时 输出 均 为 0， 写 出 输出 $. 到 5, 的 布尔 表达 式 。 

(b) 假设 输入 大 于 9 时 输出 是 无 关 项 ， 写 出 输出 5. 到 5, 的 布尔 表达 式 。 

(c) 画 出 合理 而 简单 的 门 级 来 实现 (b) 。 多 重 输出 在 合适 的 地 方 可 以 共享 门 电路 。 

一 个 电路 有 4 个 输入 ，2 个 和 输出。 输入 是 4， 代 表 从 0 ~ 15 的 一 个 数 。 如 果 这 个 输入 的 
数 是 素数 (0 和 1 不 是 素数 ,但 是 2、3、5 等 是 素数 ) ， 则 输出 尸 为 TRUE。 如 果 输 入 的 
数 可 以 被 3 整除 ， 则 输出 D 为 TRUE。 给 出 并 化 简 每 个 输出 的 布尔 表达 式 ， 画 出 电 
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路 图 。 

2. 36 一 个 优先 级 译 码 器 有 2 位 输入 。 它 将 产生 入 位 二 进 制 输出 来 表示 输入 为 TRUE 的 最 高 
有 效 位 ， 或 者 在 没有 任何 输入 为 TRUE 时 输出 0。 它 还 将 产生 一 个 输出 NONE, WREE 
没有 输入 为 有 效 时 该 输出 为 TRUE。 设计 一 个 8 输入 优先 级 译 码 器 ， 输 入 为 4， 输 出 为 
Y 和 NONE。 例如， 输入 为 00100000 时 ， 输 出 了 将 为 101，NONE 为 0。 写 出 并 化 简 每 个 
输出 的 布尔 表达 式 ， 并 且 画 出 一 个 电路 图 。 

2.37 设计 一 个 改进 的 优先 级 译 码 器 (参见 习题 2.25) 。 它 有 8 位 输入 4。， 产 生 2 个 3 位 输出 
Yoo Fi Zaos Y HREAN TRUE 的 最 高 有 效 位 。2 指示 出 输入 为 TRUE 的 第 二 高 有 效 
位 。 如 果 没 有 一 个 输入 为 TRUE ， 则 了 为 0， 如 果 不 多 于 一 个 输入 为 TRUE， 则 Z 为 0。 
给 出 每 一 个 输出 的 化 简 布 尔 表达 式 ， 并 且 画 出 原理 图 。 

2.38 一 个 肝 位 温度 计 码 (thermometer code) 在 最 低 有 效 上 位 上 为 1， 在 最 高 有 效 MM- 上 位 为 0。 
二 进 制 - 温度 计 码 转换 器 (binary-to-thermometer code convert) Æ N (ii A Al 2” -1 位 输 
出 。 它 为 输入 的 二 进 制 数 产生 一 个 2” 位 的 温度 计 码 。 例 如 ， 如 果 输 入 是 110， 则 输出 
是 0111111。 设计 一 个 3:7 二 进 制 -温度 计 码 转换 器 。 写 出 并 化 简 每 一 个 输出 的 布尔 表 
达 式 ， 并 且 画 出 原理 图 。 

2.39 写 出 图 2-87 中 电路 对 应 函数 的 最 小 布尔 表达 式 。 

2.40 Sit Al 2-88 中 电路 对 应 函数 的 最 小 布尔 表达 式 。 





图 2-87 复 用 器 电路 图 2-88 复 用 器 电路 103 | 
2.41 使 用 下 列 器 件 ， 实 现 图 2-80b 中 的 函数 。 
(a) 一 个 8:1 Al at 


(b) 一 个 4:1 复 用 器 和 一 个 非 门 
(c) — 2:1 复 用 右 和 2 个 其 他 的 逻辑 门 
2.42 ”使 用 下 列 器 件 ， 实 现 习题 2. 17(a) 中 的 函数 。 


表 2-8 习题 2. 43 ~ 习题 2. 47 的 门 延 迟 
(a) 一 个 8:1 HHA 


(b) 一 个 4:1 复 用 器 且 不 用 任何 其 他 的 逻辑 门 。 一 一 一 一 一 和 一 
(c) 一 个 2:1 复 用 器 、 一 个 或 门 和 一 个 非 门 2 输入 NAND 20 15 
2.43 确定 图 2-83 中 电路 的 传播 延迟 和 最 小 延迟 。 3 输入 NAND 30 25 
使 用 表 2-8 给 出 的 延迟 。 2 输入 NOR 30 25 
2.44 确定 图 2-84 中 电路 的 传播 延迟 和 最 小 延迟 。 3 输入 NOR sa 7 
使 用 表 2-8 给 出 的 延迟 。 a n ne 
2.45 ” 画 一 个 快速 3:8 译 码 器 的 原理 图 。 假 定 门 延迟 cone, ši i 
EK 2-8 中 给 出 (并 且 只 能 使 用 表 2-8 PHB ‘ab OR m a 
辑 门 ) 。 设 计 一 个 具有 最 短 关 键 路 径 的 译 码 2 输入 XOR 60 40 


人 艇 ， 并 指出 这 些 路 径 是 什么 ? 电路 的 传播 延迟 
和 最 小 延迟 是 多 少 ? 
2. 46 重新 为 习题 2. 35 设计 一 个 尽 可 能 快 的 电路 。 只 能 使 用 表 2-8 中 的 逻辑 门 。 画 出 新 的 电 
路 并 说 明 关 键 路 径 。 电 路 的 传播 延迟 和 最 小 延迟 是 多 少 ? 
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2.47 重新 为 习题 2.36 设计 一 个 尽 可 能 快 的 优 级 译 编码 器 。 可 以 使 用 在 表 2-8 中 的 任何 门 。 
画 出 新 的 电路 并 说 明 关键 路 径 。 电 路 的 传播 延迟 和 最 小 延迟 是 多 少 ? 
2. 48 设计 一 个 从 数据 输入 到 数据 输出 尽 可 能 最 短 延 迟 的 8:1 复 用 器 。 可 以 使 用 表 2-7 中 的 任 
何 门 。 基 于 表 2-7 给 出 的 门 延迟 ， 确 定 电路 的 延迟 。 


面试 问题 

下 述 问题 在 数字 设计 工作 的 面试 中 曾经 被 提问 。 

2.1 只 使 用 与 非 门 画 出 2 输入 或 非 门 函数 的 原理 图 ， 最 少 需要 使 用 几 个 门 ? 

2.2 设计 一 个 电路 ， 它 将 得 出 一 个 输入 月 份 是 否 有 31 天 。 月 份 用 4 位 输入 A HE. EAN, 
输入 0001 表示 1 H, HA 1100 表示 12 月 。 当 输入 月 份 有 31 天 时 ,电路 输出 了 将 为 高 电 
平 。 写 出 化 简 的 等 式 且 使 用 最 少数 量 的 门 画 出 电路 图 (提示 : 记 住 利用 无 关 项 ) 。 

2.3 什么 是 三 态 缓冲 器 ? 如 何 使 用 它 ， 为 什么 使 用 它 ? 

2.4 ”如 果 一 个 或 者 一 组 门 可 以 构造 任何 布尔 函数 ,那么 这 些 门 就 是 通用 门 。 比 如 ，| 与 门 ， 
或 门 ， 非 门 } 是 一 组 通用 门 。. 
(a) 与 门 是 通用 门 吗 ， 为 什么 ? 
(b) | 或 门 ， 非 门 } 是 一 组 通用 门 吗 ， 为 什么 ? 
(c) 与 非 门 是 通用 门 吗 ， 为 什么 ? 

2.5 解释 为 什么 电路 的 传播 延迟 可 能 小 于 ( 而 不 是 等 于 ) 它 的 最 小 延迟 。 
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第 2 章 介 绍 了 如 何 分 析 和 设计 组 合 逻辑 。 组 合 逻辑 的 输出 仅仅 取 
决 于 当前 的 输入 值 。 如 果 给 定 一 个 真 值 表 或 者 布尔 表达 式 的 形式 ， 就 
可 以 得 出 一 个 满足 规范 的 优化 电路 。 

在 本 章 中 ， 我 们 将 分 析 和 设计 时 序 (sequential ) 逻辑 。 时 序 逻 辑 的 
输出 取决 于 当前 的 输入 值 和 先前 的 输入 值 。 因 此 ， 时 序 逻 辑 具 有 记 
忆 。 时 序 逻 辑 可 能 明确 地 记 住 某 些 先前 的 输入 ， 也 可 能 从 先前 的 输入 
中 提取 更 少量 信息 ， 这 些 信息 称 为 系统 的 状态 (state) 。 一 个 数字 时 序 
逻辑 电路 的 状态 由 一 组 称 为 状态 变量 (state variable) 的 位 构成 ， 这 些 状 
态 变 量 包含 用 于 解释 电路 未 来 行为 所 需要 的 有 关 过 去 的 所 有 信息 。 

在 本 章 中 ， 我 们 将 首先 学 习 锁 存 器 和 触发 器 ， 它 们 是 存储 1 位 状 
态 的 简单 时 序 逻 辑 电路 。 通 常 ， 时 序 逻 辑 电 路 的 分 析 很 复杂 。 为 了 简 
化 设计 ， 我 们 将 只 涉及 同步 时 序 逻 辑 电路 ， 它 由 组 合 逻 辑 和 一 组 表示 
电路 状态 的 触发 器 组 成 。 本 章 还 介绍 有 限 状 态 机 ， 它 是 设计 时 序 电路 
的 一 种 简单 方法 。 最 后 ， 我 们 将 分 析 时 序 电路 的 速度 ， 讨 论 提 高 速度 
的 并 行 方法 。 


3.2 itr aa the A as 


存储 器 件 的 基本 模块 是 一 个 双 稳 态 (bistable) 元 件 ， 该 元 件 有 两 个 
稳定 状态 。 图 3-1a 显示 了 由 连接 成 环 的 一 对 反 相 器 组 成 的 简单 的 双 稳 
态 元 件 。 图 3-1b 显示 了 相同 的 电路 ， 以 便 突 出 其 对 称 性 。 这 两 个 反 相 


>“hello 


操作 系统 








At 20 04% 4 (cross-coupled), Bl Il 的 输入 是 了 的 输出 ， | b> g 
反之 亦 然 。 这 个 电路 没有 输入 ， 但 是 它 有 两 个 输出 ，Q@ a 
和 @。 分 析 这 个 电路 与 分 析 组 合 电路 不 同 ， 因 为 它 是 循 = 
环 的 : 0 取决 于 @， 反 过 来 0 又 取决 于 0。 | Nos 
考虑 两 种 情况 ，0 = 0 或 者 0 = 1。 针 对 每 一 种 情况 a) b) 
ns TPAR 图 3-1 交叉 耦合 的 反 相 器 对 
e 情况 I: Q=0 


如 图 3-2a 所 示 ，D 的 输入 0 =0， 因 此 在 Q 上 的 
输出 为 1。I1 的 输入 Q=1， 因 此 在 Q 上 的 输出 为 
0。 这 与 原来 的 假设 0 = 0 是 一 致 的 ， 因 此 这 种 情 
况 称 为 稳 态 。 

e 情况 全 : O=1 
如 图 3-2b 所 示 ，I2 的 输入 为 1， 因 此 在 O 上 的 输 
出 0。11 的 输入 Q =0， 因 此 在 O 上 的 输出 1， 这 图 3-2 ， 交 又 耦合 反 相 器 的 双 稳 态 操作 
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也 是 一 种 稳 态 。 
因为 交叉 耦合 反 相 器 有 两 种 稳定 状态 : 0 =0 和 0Q =1， 所 以 该 电路 称 为 双 稳 态 。 微 妙 的 一 


点 是 ， 电 路 可 能 存在 第 三 种 状态 ， 其 两 个 输出 均 大 约 处 于 0 ~1 之 间 的 一 半 。 这 种 状态 称 为 亚 


稳 态 (metastable) ， 将 在 3.5.4 节 中 再 进行 讨论 。 

具有 N 种 稳 态 的 元 件 可 以 表示 log N 位 的 信息 ， 所 以 双 稳 态 元 件 可 以 存储 1 位 信息 。 交 叉 
耦合 反 相 器 的 状态 包含 在 二 进 制 状态 变量 0 Po O 的 值 保 存 了 用 于 解释 电路 未 来 行为 所 需要 的 
有 关 过 去 的 所 有 信息 。 尤 其 是 ， 如 果 0 =0， 则 它 将 永远 为 0， 如 果 0 =1， 它 将 永远 为 AX 
如 果 @ 是 已 知 的 ， 则 @ 也 是 已 知 的 ， 所 以 电路 有 另 一 个 结 点 8， 但 8 不 包含 其 他 任何 信息 。 另 
一 方面 ，Q@ 也 可 以 作为 一 个 有 效 的 状态 变量 。 

当 第 一 次 给 此 时 序 电 路 加 电 时 ， 它 的 初始 状态 是 未 知 的 并 且 通 常 是 不 可 预测 的 。 电 路 每 一 
次 启动 的 初始 状态 有 可 能 都 不 同 。 

虽然 交叉 耦合 反 相 器 可 以 存储 1 位 的 信息 ,但 因为 用 户 没有 控制 状态 的 输入 ， 所 以 它 并 没 
有 什么 实用 价值 。 然 而 ， 其 他 的 双 稳 态 元 件 ， 比 如 锁 存 器 和 触发 器 ， 提 供 了 可 以 控制 状态 变量 
值 的 输入 。 本 节 的 下 面部 分 将 介绍 这 些 电路 。 


3.2.1 SR 锁 存 器 


SR 锁 存 器 是 最 简单 的 时 序 电 路 。 如 图 3-3 所 示 ， 它 由 一 对 交叉 耦合 的 或 非 门 组 成 。SR 锁 
存 器 有 两 个 输入 SAR, HPO 和 0O。SR 锁 存 器 与 交叉 耦合 反 。 Dar 
相 器 相似 ,但 是 它 的 状态 可 以 通过 输入 S RKR, E Beet ta 


(set) 或 复位 (reset) 输 出 Qo CE 
通过 真 值 表 可 以 理解 陌生 的 电路 。 或 非 门 中 只 要 有 一 个 输 和 为。 s_ N28 
ne 

e HOI: _ §=0 图 3-3 SR 锁 存 器 原理 图 
NI a a eA 的 输入 ， 则 输出 0 =0。N2 的 输入 0Q =0 和 5 =0， 则 输出 0 = 1。 

è 情况 了: R=0, S=1 
NI 的 输入 为 0 和 Q。 因 为 还 不 知道 @ 的 值 ， 所 以 不 能 确定 输出 的 Q 值 。N2 至 少 有 一 
个 S=1 的 输入 ， 则 输出 0 =0。 再 次 研究 N1， 可 以 知道 它 的 两 个 输入 都 为 0， 所 以 输 
出 0 =1。 

e mi: R=1, S=1 
N1 和 N2 至 少 有 一 个 输入 (R 或 者 5) 为 1， 于 是 每 一 个 都 产生 输出 0。 所 以 8 和 0 同时 
为 0。 

e ÈN: R=0, S=0 
NI 的 输入 为 0 和 0。 因 为 还 不 知道 0 的 值 ， 所 以 不 能 确定 
输出 。N2 的 输入 为 0 和 0。 因为 不 知道 0 的 值 ， 所 以 也 不 
能 确定 输出 。 我 们 在 这 里 被 卡 住 了 。 这 与 交叉 耦合 反 相 器 
类 似 。 但 是 我 们 知道 0 必须 为 0 或 1。 因 此， 可 以 通过 考察 
= 种 子 情 况 的 方法 来 解决 这 个 问题 。 

e 情况 Va: 0O =0 
因为 5- 0, 0 =0， 所 以 N2 在 Q 上 的 输出 为 1， 如 图 3-4a 所 
Ro MEN 的 输入 @ 为 1， 所 以 它 的 输出 0 =0， 这 与 原来 
的 假设 是 一 致 的 。 

e 情况 IJVb: Q=1 
因为 0=1， 所 以 N2 在 Q 上 的 输出 为 0， 如 图 3-4b 所 示 。 图 3-4 SR 锁 存 器 的 双 稳 态 
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现在 NI 的 两 个 输入 尺 =0 且 0 =1， 因 此 它 的 输出 0 =1， 这 与 原来 的 假设 是 一 致 的 。 
综 上 所 述 ， 假 设 0 有 一 些 已 知 的 先前 值 ， 记 为 O,。， 在 我 们 进入 情况 了 之 前 。Q ,为 1 
RO, 表示 系统 的 状态 。 当 R=5=0 时 ，0 将 保持 原来 的 值 O PE, O 将 取 0 初 值 的 
反 值 O..,。 这 个 电路 有 记忆 功能 。 

-图 3-5 中 的 真 值 表 总 结 了 4 种 情况 。 输 入 5 和 尺 表 示 置 位 (Set) 





情况 s R|OQ 0 
和 复位 ( Reset) 。 置 位 表示 将 1 位 设置 为 1， 复 位 表示 将 1 位 设置 为 IV Oo 0 | Uw Coe 
0, With OM QHRAARIA. SRAM, ORBAN, 0 设置 > a : A z 
为 1。 当 S$ 有效 时 ,0Q 设置 为 1!，0Q 设置 为 0。 当 输入 均 为 无 效 时 ， II IE 149" 


0 将 保持 原来 的 值 Qu DE RA S 同时 有 效 是 没有 意义 的 ， 因 为 


3-5 SK 锁 存 器 真 值 表 
锁 存 融 不 可 能 同时 被 置 位 或 者 复位 。 这 样 会 产生 两 个 输出 为 0 的 混 


乱 电 路 响应 。 

SR 锁 存 器 的 符号 表示 如 图 3-6 所 示 。 使 用 符号 表示 SR 锁 存 器 ~~ 
是 抽象 化 和 模块 化 的 一 个 应 用 。 有 很 多 种 方法 可 以 构造 SR 锁 存 器 ， 3 
例如 使 用 不 同 的 逻辑 门 或 者 晶体 管 。 然 而 ,满足 图 3-5 中 真 值 表 和 有 


图 3-6 中 符号 的 给 定 关系 的 电路 元 件 称 为 SR 锁 存 器 。 iis waite 

与 交叉 耦合 反 相 器 一 样 ，SR 锁 存 器 是 一 个 在 CO 上 存储 1 位 状 
态 的 双 稳 态 元 件 。 但 是 ， 状 态 可 以 通过 输入 S 和 及 控制 。 当 尺 有 效 时 ， 状 态 复位 为 0。 当 S 有 
效 时 ， 状 态 设置 位 为 1。 当 $ 入 都 无 效 时 ， 状 态 保持 旧 值 不 变 。 注 意 ， 输 入 的 全 部 历史 可 以 
由 状态 变量 0 解释 。 无 论 过 去 置 位 或 复位 是 如 何 发 生 的 ， 都 需要 通过 最 近 一 次 置 位 或 复位 操作 
来 预测 SR 锁 存 器 的 未 来 行为 。 


3.2.2 D 锁 存 器 


当 SR 锁 存 器 中 的 5 和 同时 有 效 时 ， 其 输出 不 确定 ,使 用 起 来 很 不 方便 。 而且, 输入 5 
和 只 混淆 了 时 间 和 内 容 。 当 输入 有 效 时 ， 不 仅 需要 确定 内 容 是 什么 ,而且 还 需要 确定 何 时 改 
变 。 将 内 容 和 时 间 分 开 考虑 将 使 电路 设计 将 变 得 简单 。 图 3-7a 中 的 D 锁 存 器 解决 了 这 些 问题 。 
它 有 2 个 输入 : 数据 输入 D， 用 来 控制 下 一 个 状态 的 值 ; 时 钟 输入 CLK， 用 来 控制 状态 发 生 改 
变 的 时 间 。 

此 外 ， 我 们 还 可 以 通过 图 3-7b 中 的 真 值 表 来 分 析 D 锁 存 器 。 为 了 方便 ， 我 们 首先 考虑 外 
MAD, SHIR, WE CLK =0， 则 S=R=FALSE, 无 论 D 的 值 是 什么 。 如 果 CLK =1， 根 据 
D 的 值 ， 一 个 与 门 输出 TRUE ， 而 另 一 个 与 门 输出 FALSE, AE SAR, QA Q 的 值 可 以 根据 
图 3-5 确 定 。 注 意 当 CLK =0 时 ，Q 将 保持 原来 的 值 0,, 不 变 。 当 CLK =1 t, =D。 在 所 有 
情况 中 ，Q 是 Q 的 反 ， 符合 逻辑 。D 锁 存 器 避免 了 $ 和 尺 同 时 有 效 而 造成 的 奇怪 情况 。 

综 上 所 述 ， 时 钟 可 以 控制 何 时 数据 通过 锁 存 器 。 当 CLK = 1 时 ，D 锁 存 器 是 透明 的 (trans- 
parent), SE D 通过 DD 锁 存 器 流向 8， 好像 D 锁 存 器 就 是 一 个 缓冲 器 。 当 CLK =0 时 ，D 锁 存 
器 是 不 透明 (opaque)。 它 阻塞 新 数据 D 通过 DD 锁 存 器 流向 0，Q 保持 原来 的 值 不 变 。 所 以 DD 锁 
存 器 又 称 为 透明 锁 存 器 或 者 电 平 敏感 锁 存 器 。D 锁 存 器 的 电路 符号 如 图 3-7c 所 示 。 


3-7 D 锁 存 器 
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当 CLK =1 时 ，D 锁 存 器 不 断 更 新 它 的 状态 。 在 本 节 的 后 面 将 看 到 ， 如 何在 特定 时 刻 更 新 
状态 。 下 一 节 将 介绍 D 触发 器 。 


3.2.3 D 触发 器 


一 个 DD fe KS ATW h AT PSA PSEA D 锁 存 器 构成 ， 如 图 3-8a 所 示 。 第 一 
个 锁 存 器 LI 称 为 主 锁 存 器 。 第 二 个 锁 存 器 12 称 为 从 锁 存 器 。 它 们 之 间 的 结 点 为 N1。 图 3-8b 
给 出 了 D 触发 器 的 电路 符号 。 当 不 需要 输出 0 时 ，D 触发 器 的 符号 可 以 简化 成 图 3-8c。 


a) 原理 图 b) 电路 符号 c) 简化 的 电路 符号 


图 3-8 D 触发 器 


当 CLK =0 时 ， 主 锁 存 器 是 透明 的 ， 从 锁 存 器 是 不 透明 的 。 所 以 , 九 的 值 将 无 条 件 地 传送 
到 N1。 当 CLK =1 时 ， 主 锁 存 器 变 成 不 透明 的 ， 从 锁 存 器 变 成 透明 的 。N1 的 值 将 传送 到 Q, 
但 是 N1 与 D 之 间 被 切断 。 所 以 ,在 时 钟 从 0 上 升 到 1 之 前 在 时 钟 变 为 1 之 后 D 值 立即 被 复制 
BQ. 在 其 他 任何 时 刻 ， 因 为 总 有 一 个 阻塞 从 D 到 0 之 间 通 路 的 不 透明 的 锁 存 器 ， 所 以 O 保持 
原来 的 值 。 

换 句 话说 ，D 触发 器 在 时 钟 上 升 沿 将 DD 复制 到 QQ， 在 其 他 时 间 D 触发 器 保持 原来 的 状态 。 
一 定 要 记 住 这 个 定义 ,一 个 刚 入 门 的 数字 设计 师 经 常 忘 记 某 个 触发 妖 的 功能 。 时 钟 的 上 升 沿 也 
经 常 简 称 为 时 钟 沿 (clock edge)。 输 入 DD 确定 新 的 状态 ， 时 钟 沿 确定 状态 发 生 改 变 的 时 间 。 

D 触发 器 也 经 常 称 为 主 从 触发 器 (master-slave flip-flop)、 边 沿 触 发 器 (edge-triggered flip- 
flop ) 或 者 正 边沿 触发 器 (positive edge-triggered flip-flop)。 电 路 符号 中 的 三 角形 表示 沿 触发 时 钟 
输入 。 当 不 需要 输出 0 时 ， 它 经 常 被 省 略 。 

计算 触发 器 的 晶体 管 数量 

构成 一 个 本 节 介 绍 的 D 触发 器 需要 多 少 个 晶体 管 ? 

解 : 构成 一 个 与 非 门 或 者 一 个 或 非 门 需要 用 4 个 晶体 
管 。 一 个 非 门 需要 用 2 个 晶体 管 。 一 个 与 门 可 以 由 一 个 与 非 
门 和 一 个 非 门 组 成 ， 所 以 它 将 用 6 个 晶体 管 。 一 个 SR 锁 存 
器 需要 2 个 或 非 门 ,或 8 个 晶体 管 。 一 个 D 锁 存 器 由 1 个 SR 
锁 存 器 、2 个 与 门 和 1 个 非 门 组 成 ， 即 22 个 晶体 管 。D 触发 
器 由 2 个 D 锁 存 器 和 1 个 非 门 组 成 ; 即 46 个 晶体 管 组 成 。 
3.2.7 节 将 介绍 一 种 使 用 传输 门 的 更 高 效 CMOS 实现 方法 。 十 


3.2.4 寄存 器 


一 个 W 位 寄存 器 由 共享 一 个 公共 CLK 输入 的 一 排 个 ane 
触发 器 组 成 ， 这 样 寄存 器 的 所 有 位 同时 被 更 新 。 寄 存 器 是 大 ses 
多 数 时 序 电 路 的 关键 组 件 。 图 3-9 给 出 了 其 原理 图 和 一 个 带 dw fo, 
有 输入 D;。 和 输出 Qs.) hI 4 位 寄存 器 。D3。 和 0;%。 均 为 4 位 a) 原理 图 b) 电路 符号 
总 线 。 图 3-9 4 位 寄存 器 
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3.2.5 市 使 能 端的 触发 器 


带 使 能 端的 触发 器 (enabled flip-flop) 增 加 了 男 一 个 称 为 EN 或 ENABLE 的 输入 ,该 输入 用 
于 确定 在 时 钟 沿 是 否 载 人 数据 。 当 EN =TRUE 时 ， 带 使 能 端的 触发 器 与 普通 的 DD 触发 器 一 样 。 
当 EN =0 时 ， 带 使 能 端的 触发 器 忽略 时 钟 ， 保 持原 来 的 状态 不 变 。 当 我 们 和 希望 在 某 些 时 间 ( 而 
不 是 在 每 一 个 时 钟 沿 ) 载 人 一 个 新 值 到 触发 器 中 时 ， 带 使 能 端的 触发 器 非常 有 用 。 

图 3-10 给 出 了 用 一 个 D 触发 器 和 一 个 额外 的 门 组 成 一 个 带 使 能 端的 触发 器 的 两 种 方法 。 
在 图 3-10a 中 ， 如 果 EN =TRUE， 则 一 个 输入 复 用 器 选择 是 否 传 递 D 的 值 ， 如 果 EN = FALSE, 
再 次 循环 QO 的 原来 状态 。 在 图 3-10b 中 ， 时 钟 被 门 控 (gated) 。 如 果 EN =TRUE， 则 通常 切换 触 
发 器 的 CLK 输入 。 如 果 EN =FALSE， 则 CLK 输入 也 是 FALSE 且 触 发 器 保持 原来 的 值 不 变 。 注 
意 ， 当 CLK =1 时 ，EN 不 能 改变 ;以 免 触 发 器 出 现 一 个 时 钟 毛刺 (在 不 正确 的 时 间 进 行 切换 ) 。 
一 般 而 言 ， 在 时 钟 上 执行 逻辑 不 是 一 个 好 主意 。 时 钟 门 控 可 能 使 时 钟 延迟 并 导致 时 序 错误 ， 将 
在 3. 5.3 节 中 进一步 介绍 。 只 有 当 你 确实 知道 要 做 什么 时 ， 才 能 这 样 做 。 带 使 能 端的 触发 器 的 
电路 符号 如 图 3-10c 所 示 。 


CLK EN 


a) 原理 图 b) 原理 图 c) 电路 符号 
图 3-10 人 带 使 能 端的 触发 右 


3.2.6 市 复位 功能 的 触发 天 


带 复位 功能 的 触发 器 (resettable flip-flop) 增 加 了 一 个 称 为 RESET 的 输入 。 当 RESET = 
FALSE 时 ， 带 复位 功能 的 触发 器 与 普通 的 D 触发 器 一 样 。 当 RESET =TRUE， 带 复位 功能 的 触 
发 器 忽略 D 并 将 输出 0 复位 为 0。 当 第 一 次 打开 带 复位 功能 的 触发 器 时 需要 将 所 有 触发 器 设置 
为 已 知 状态 ( 即 ，0) ， 这 时 带 复位 功能 的 触发 器 是 非常 有 用 的 。 

触发 器 可 能 是 异步 复位 或 者 同步 复位 。 带 同步 复位 功能 的 触发 器 只 在 CLK 上 升 沿 进行 复 
位 。 带 异步 复位 功能 的 触发 器 只 要 RESET = TRUE 就 可 以 对 它 进行 复位 ， 而 与 CLK 无 关 。 

图 3-11a 显示 了 如 何 使 用 D 触发 器 和 与 门 来 构造 带 同步 复位 功能 的 触发 器 。 当 RESET = 
FALSE 时 ， 与 门将 0 传送 到 触发 器 的 输入 端 。 当 RESET = TRUE 时 ， 与 门将 D 传送 到 触发 器 。 
在 这 个 例子 中 ，RESET 是 一 个 低 电 平 有 效 (active low) 信 号 ， 即 当 复 位 信号 为 0 时 执行 对 应 功 
能 。 通 过 增加 一 个 反 相 器 ， 电 路 可 以 用 高 电 平 有 效 复 位 信号 代替 。 图 3-11b、e 是 高 电 平 有 效 
复位 触发 器 的 符号 。 


CLK 
LN 
D 
RESET by ot) Q Q ¥ 
RESET r 


a) 原理 图 b ) 电路 符号 c) 电路 符号 
图 3-11 同步 复位 触发 器 
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带 异 步 复位 功能 的 触发 器 需要 调整 触发 器 的 内 部 结构 ， 把 它 留 在 习题 3. 10 中 。 它 们 也 是 
设计 师 经 常用 到 的 基本 组 件 。 

可 以 想象 ， 带 置 位 功能 的 触发 右 也 偶尔 被 使 用 。 当 置 位 时 ， 将 触发 怖 设置 为 1。 它 们 以 同 
步 或 异步 方式 完成 置 位 操作 。 带 置 位 和 复位 功能 的 触发 器 可 以 带 有 使 能 输入 端 ， 也 可 以 组 成 和 
位 寄存 需 。 


3.2.7 晶体 管 级 锁 存 器 和 触发 器 的 设计 


例 3.1 说 明了 通过 逻辑 门 构造 锁 存 器 和 触发 器 需要 大 量 的 晶体 管 。 但 是 锁 存 器 的 基本 作用 
是 透明 或 者 不 透明 ， 类 似 于 一 个 开关 。 回 忆 1.7.7 节 内 容 ， 传 输 门 是 构成 CMOS 开关 的 有 效 方 
法 ， 因 此 可 以 利用 传输 门 来 减少 晶体 管 的 数量 。 
一 个 紧凑 D 锁 存 器 可 以 用 一 个 单独 的 传输 门 构成 ， 如 图 3-12a 所 示 。 当 CLK =1 和 CLK =0 
时 ， 传 输 门 是 ON( 打 开 的 ) ， 因 此 DD 传输 到 O, 该 锁 存 器 是 透明 的 。 当 CLK =0 和 CLK = 1 时 ， 
传输 门 是 OFF( 关 闭 的 )， 因 此 D 与 0 是 隔离 的 ， 且 该 锁 存 器 是 不 透明 的 。 这 种 锁 存 器 有 两 个 
主要 缺点 : 
e 输出 结 点 浮 空 : 当 锁 存 器 不 透明 时 ， 任 何 门 都 不 保存 Q 值 。 所 以 0 RHF (floating) 
结 点 或 者 动态 (dynamic) 结 点 。 经 过 一 段 时 间 后 ， 噪 声 和 电荷 泄漏 将 干扰 0 的 值 。 

© 没有 缓冲 器 : 没有 缓冲 器 将 在 众多 商业 芯片 中 造成 故障 。 即 使 在 CLK =0 时 ， 如 果 将 D 
值 拉 成 一 个 负电 压 的 噪声 尖峰 ， 也 可 以 打开 nMOS 晶体 管 ， 使 锁 存 器 透明 。 同 样 ， 即 
使 当 CLK =0 FT, AF Vy EM D 的 噪声 尖峰 也 可 以 使 pMOS 晶体 管 透明 。 由 于 传输 门 
是 对 称 的 ， 所 以 这 使 得 在 Q 上 的 噪声 可 以 反 向 驱动 而 影响 输入 D。 通 用 规则 是 传输 门 
的 输入 或 时 序 电 路 的 状态 结 点 都 不 应 暴露 在 有 噪声 的 外 部 世界 中 。 

图 3-12b 显示 了 一 个 在 现代 商业 芯片 中 由 12 个 晶体 管 构成 的 D 锁 存 器 。 它 也 可 以 用 时 钟 
控制 的 传输 门 来 构成 ， 但 是 它 增 加 了 反 相 器 I1 和 了 作为 输入 和 输出 的 缓冲 器 。 锁 存 器 的 状态 
保存 在 结 点 N1 上 。 反 相 器 B 和 三 态 缓冲 器 T1， 给 N HERR, HN 成 为 固定 结 点 。 当 
CLK =0 时 ， 如 果 在 NI 上 产生 一 个 小 的 噪声 ， 则 Tl 将 驱动 N 回 到 有 效 的 逻辑 值 。 

图 3-13 显示 了 由 CLK 和 CLK 控 制 的 两 个 静态 锁 存 器 构成 的 DD 触发 器 。 去 除了 一 些 多 余 的 
内 部 反 相 器 ， 所 以 这 个 触发 器 只 需要 20 个 晶体 管 。 





sii 
D- +Q 
nP 
CLK 
a) 
图 3-12 D 锁 存 器 的 原理 图 图 3-13 D 触发 器 的 原理 图 
3. 2.8 小 结 


锁 存 器 和 触发 器 是 时 序 电路 的 基本 构件 。 记 住 ，D 锁 存 器 是 电 乎 敏感 的 ， 而 D 触发 器 是 边 
沿 触发 的 。 当 CLK =1 时 ，D 锁 存 器 是 透明 的 ， 允 许 输入 DD 传输 到 输出 0。D fh Acai fe CLK 的 
沿 将 刀 值 复制 到 Q@。 在 其 他 时 候 ， 锁 存 器 和 触发 器 保持 原来 的 状态 不 变 。 寄 存 器 由 共享 一 个 公 
共 CLK 信号 的 一 排 多 个 D 触发 器 构成 。 
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触发 器 和 锁 存 器 比较 

如 图 3-14 所 示 ，Ben 将 D 和 CLK 输入 应 用 到 D 锁 存 器 和 了 D fh Aah AREA Ben 确定 每 一 
种 硕 件 的 输出 Qo 

解 : 图 3-15 给 出 了 输出 波形 。 假 设 在 输入 变化 时 ， 输 出 CQ 有 一 个 小 的 延迟 。 箭 头 表 示 导 
致 输出 改变 的 原因 。@ 的 初 值 是 未 知 的 ， 可 能 是 0 或 1， 用 一 对 水 平 线 表示 。 首 先 考虑 锁 存 器 。 
在 CLK 的 第 一 个 上 升 沿 ，D =0， 所 以 QO 肯定 变 成 0。 当 CLK =1 At, ERD 改变 都 会 导致 0 改 
变 。 当 CLK =0 时 , D KHE, 不 变 。 接 着 考虑 触发 器 。 在 CLK 的 每 一 个 上 升 沿 ， 将 五 复制 到 
Q, 在 所 有 其 他 时 间 ，Q 保持 原来 的 状态 不 变 。 < 


CLK 


Per ae hi ne agi ce tone oe 
O ( 锁 存 器 ) 
O (下 降 ) 

图 3-14 例子 的 波形 


A 
0 ( 锁 存 器 | A È 
O ( FRE) ` 
图 3-15 RIJE 


3.3 同步 逻辑 设计 

一 般 而 言 ， 时 序 电 路 包括 所 有 不 是 组 合 电 路 的 电路 ， 也 就 是 说 ， 这 些 电 路 的 输出 不 能 简单 
地 通过 观察 当前 的 输入 来 确定 。 有 些 时 序 电 路 比较 奇特 。 本 节 将 考察 这 些 电 路 ， 然 后 介绍 同步 
时 序 电 路 的 概念 和 动态 约束 。 我 们 将 重点 讨论 同步 时 序 电 路 ， 这 将 使 我 们 找到 一 种 简单 、 系 统 
的 方法 来 设计 和 分 析 时 序 电 路 系统 。 


3.3.1 一 些 有 问题 的 电路 x 


非 稳 态 电路 
Alyssa P. Hacker 遇 到 了 3 个 拙劣 设计 的 反 相 器 ， 它 
们 以 环 状 连接 在 一 起 ， 如 图 3-16 所 示 。 第 三 个 反 相 器 
的 输出 反馈 到 第 一 个 反 相 器 。 每 个 反 相 器 都 有 Ins 的 传 OX 
播 延 迟 。 确 定 电 路 的 功能 。 7 
fe: 假设 结 点 的 初 值 是 0。 那么 Y=1, Z=0, 因 z 
IRAS, PRAIA A (unstable) RAMA (astable), H © | 2345 6 7 8 MICs) 
路 的 行为 如 图 3-17 R.o WR X ERZO 上 升 ， 则 了 将 图 3-17 ”环形 振荡 器 的 波形 


图 3-16 3 个 反 相 需 的 环 
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在 Ins 时 下 降 ，2Z 将 在 2ns 时 上 升 , X 将 在 3ns 时 下 降 。 接 着 ， 了 在 4ns 时 上 升 ，Z 将 在 Sns 时 
PRE, XKE Ons 时 再 次 上 升 ， 这 个 模式 将 一 直 重 复 下 去 。 每 个 结 点 以 Ons 为 周期 在 0~1 之 间 
摆动 。 这 个 电路 称 为 环形 振荡 器 (ring oscillator) 。 

环形 振 功 峰 的 周期 取决 于 每 个 反 相 器 的 传播 延迟 。 这 个 延迟 又 取决 于 反 相 器 的 制造 工艺 、 
电源 电压 ， 其 至 工作 温度 等 。 所 以 很 难 准确 预测 环形 振荡 器 的 周期 。 简 而 言 之 ， 环 形 振荡 器 是 
零 输 入 和 一 个 (周期 性 改变 的 ) 输 出 的 时 序 电 路 。 < 

竞争 条 件 

Ben 设计 了 一 个 新 的 D 锁 存 器 ， 并 且 他 宣布 这 个 设计 比 图 3-17 中 的 D 锁 存 器 更 好 。 因 为 
在 这 个 电路 中 门 的 数量 更 少 。 他 写 出 了 真 值 表 来 确定 输出 0， 给 定 两 个 输入 D 和 CLK 以 及 锁 
存 器 的 原来 状态 0,.,。 根 据 这 个 真 值 表 ，Ben 得 出 布尔 表达 式 。 他 通过 将 输出 0 反馈 得 到 
Quo 他 的 设计 如 图 3-18 所 示 。 他 的 锁 存 器 是 否 能 正确 工作 ， 不 考虑 每 个 门 的 延迟 ? 

解 : 如 图 3-19 所 示 ， 当 某 些 门 比 其 他 门 的 速度 慢 时 ， 有 竞争 的 条 件 (race condition) 电路 将 
导致 电路 故障 。 假 设 CLK = D =1。 锁 存 器 是 透明 的 ,将 D 传送 到 0 使 0 =1。 现 在 CLK 下 降 。 
锁 存 器 应 该 记 住 它 原来 的 值 ， 保 持 0 =1。 但 是 ,假设 从 CLK 到 CLK 通 过 反 相 器 的 延迟 比 与 门 
和 或 门 的 延迟 长 。 那 么 在 CLK 上 升 前 ， 结 点 N1 AQ 可 能 同时 下 降 。 在 这 种 情况 下 ，N2 将 不 能 
EF, 0 值 将 停留 在 0。 
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图 3-18 一 个 看 似 改进 的 DD 锁 存 器 3-19 描述 竞争 条 件 的 锁 存 器 的 波形 


这 是 一 个 输出 直接 反馈 到 输入 的 异步 电路 设计 的 例子 。 异 步 电 路 中 经 常会 出 现 竞争 条 件 而 
难以 掌握 。 之 所 以 出 现 竞争 条 件 ， 是 因为 其 电路 的 行为 取决 于 两 条 通过 逻辑 门 的 路 径 中 哪 条 最 
快 。 这 样 的 电路 可 以 工作 ， 但 是 对 于 从 表面 上 看 似 相同 的 电路 ， 如 果 用 几 个 延迟 有 些 不 同 的 门 
蔡 换 ， 可 能 就 无 法 正常 工作 。 或 者 ， 这 样 的 电路 只 能 在 一 定 的 温度 和 电压 下 正常 工作 ， 只 有 在 
这 个 特定 的 条 件 下 其 逻辑 门 的 延迟 才刚 好 正确 。 这 种 错误 是 极其 难 查 出 来 的 。 < 


3.3.2 同步 时 序 电 路 


前 面 的 两 个 例子 包含 了 称 为 环 路 (cyclic path) 的 环 ， 它 的 输出 直接 反馈 到 输入 。 它 们 是 时 
序 电路 而 不 是 组 合 电路 。 组 合 逻 辑 没有 环 路 和 竞争 。 如 果 将 输入 应 用 到 组 合 逻 辑 中 ， 输 出 总 是 
在 传播 延迟 内 稳定 为 一 个 正确 的 值 。 但 是 ， 包 含 环 路 的 时 序 电 路 存在 不 良 的 竞争 或 不 稳定 的 行 
为 。 分 析 这 样 的 电路 问题 十 分 耗 时 ， 很 多 聪明 的 人 都 会 犯错 误 。 

为 了 避免 这 些 问题 ， 设 计 师 在 路 径 中 插入 寄存 器 来 断 开 环 路 。 这 将 电路 转变 成 组 合 逻 辑 电 
路 和 寄存 器 的 集合 。 寄 存 器 包含 系统 的 状态 ， 这 些 状态 仅仅 在 时 钟 沿 到 达 时 发 生 改 变 ， 所 以 我 
们 说 状态 同步 于 时 钟 信 号 。 如 果 时 钟 足够 慢 ， 使 得 在 下 一 个 时 钟 沿 到 达 之 前 输入 到 寄存 器 的 信 
号 都 可 以 稳定 下 来 ， 那 么 所 有 的 竞争 都 将 被 消除 。 根 据 反 馈 环 路 上 总 是 使 用 寄存 器 的 原则 ， 可 
以 得 到 同步 时 序 电路 的 一 个 形式 化 定义 。 

通过 电路 的 输入 、 输 出 端 、 功 能 规范 和 时 序 规范 可 以 定义 一 个 电路 。 一 个 时 序 电 路 有 一 组 
有 限 的 离散 状态 |S。，S, ，…，S,_1}。 同 步 时 序 电路 (synchronous sequential circuit) 有 一 个 时 钟 
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输入 ， 它 的 上 升 沿 表示 时 序 电 路 状态 转变 发 生 的 时 间 。 我 们 经 常 使 用 术语 当前 状态 (current 
state) 和 下 一 个 状态 (next state) 来 区 分 目前 系统 的 状态 和 下 一 个 时 钟 沿 系统 将 进入 的 状态 。 功 
能 规范 详细 说 明了 对 于 当前 状态 和 输入 值 的 各 种 组 合 ， 每 个 输出 的 下 一 个 和 值 。 时 序 规范 包括 
上 界 时 间 和 下 界 时 间 t,,,。， 它 是 从 时 钟 的 上 升 沿 直 到 输出 改变 的 时 间 以 及 建立 时 间 terup IER 
持 时 间 ts， 它 表示 当 输 入 必须 相对 于 时 钟 的 上 升 沿 稳定 。 

同步 时 序 电 路 的 组 成 规则 告诉 我 们 ， 一 个 电路 是 同步 时 序 电 路 ， 如 果 它 由 相互 连接 的 电路 
元 件 构成 ， 且 需要 满足 以 下 条 件 : 

。 每 一 个 电路 元 件 或 者 是 寄存 器 或 者 是 组 合 电路 。 

© 至少 有 一 个 电路 元 件 是 寄存 器 。 

e。 所 有 寄存 器 都 接收 同一 个 时 钟 信和 号。 

。 每 个 环 路 至 少 包含 一 个 寄存 器 。 
非 同步 的 时 序 电 路 称 为 异步 (asynchronous) 电 路 。 


单个 触发 器 是 一 最 简单 的 同步 时 序 电路 。 它 包含 一 个 输入 D, CLK 
一 个 时 钟 CLK、 一 个 输出 O 和 两 个 状态 10，1|} 。 触 发 器 的 功能 规范 v 
是 ,下 一 个 状态 是 也， 输出 0 是 当前 的 状态 ， 如 图 3-20 所 示 。 5 pe -s 
我 们 经 常 称 当前 状态 变量 S 和 下 一 个 状态 变量 5'。 在 这 种 情况 a nite 
下 ,，S 之 后 的 撤 号 (') 表 示 下 一 个 状态 ， 而 不 是 取 反 。3.5 节 将 分 析 
时 序 电路 的 时 序 关系 。 Er 
两 种 常见 的 同步 时 序 电路 称 为 有 限 状态 机 和 流水 线 。 这 些 将 在 aA PPAR 


本 章 的 后 面 介 绍 。 

同步 时 序 电路 

图 3-21 中 的 哪些 电路 是 同步 时 序 电路 ? 

解 : 电路 a) 是 组 合 逻辑 电路 ， 不 是 时 序 逻 辑 电路 ， 因 为 它 没 有 寄存 器 。 电 路 b) 是 一 个 不 
带 反馈 回路 的 简单 时 序 电 路 。 电 路 e) 既 不 是 组 合 电路 也 不 是 时 序 电 路 ， 因 为 它 有 一 个 锁 存 器 ， 
这 个 锁 存 器 既 不 是 寄存 器 也 不 是 组 合 逻 辑 电路 。 电 路 d) 和 e) 是 同步 时 序 逻 辑 电路 。 它 们 是 有 
限 状态 机 的 两 种 形式 ， 将 在 3. 4 节 中 讨论 。 电 路 全 既 不 是 组 合 电路 也 不 是 时 序 电路 ， 因 为 它 有 
一 个 从 组 合 逻 辑 电 路 的 输出 端 反 馈 到 同一 逻辑 电路 的 输入 端的 回路 ， 但 是 在 回路 上 没有 寄存 
器 。 电 路 g) 是 同步 时 序 逻 辑 电路 的 流水 线形 式 ， 将 在 3.6 节 中 讨论 。 电 路 hb) 严格 地 说 不 是 同 
步 时 序 电路 ， 因 为 两 个 寄存 器 的 时 钟 信号 不 同 ， 它 们 有 2 个 反 相 器 的 延迟 。 4 


CLK 
a ) b) c) 
CLK CLK 

(xk 4 

d) e) 
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f) g) h ) 


图 3-21 例子 电路 
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3.3.3 同步 电路 和 异步 电路 


理论 上 ， 异步 电路 设计 比 同步 电路 设计 更 通用 ， 因 为 系统 的 时 序 不 由 时 钟 控制 的 寄存 器 所 
约束 。 正 如 使 用 任意 电压 的 模拟 电路 比 数字 电路 更 通用 一 样 ， 能 够 使 用 各 种 反馈 的 异步 电路 比 
同步 电路 更 通用 。 然 而 ， 同 步 电路 比 异 步 电路 更 容易 设计 ， 就 好 像 数字 电路 比 模拟 电路 更 容易 
一 样 。 尽 管 对 异步 电路 的 研究 进行 了 数 十 年 ， 但 实际 上 几乎 所 有 的 系统 本 质 上 都 是 同步 的 。 

当然 ， 在 两 个 不 同时 钟 的 系统 之 间 进行 通信 时 ， 或 者 在 任意 时 刻 接收 输入 时 ， 异 步 电 路 侦 
尔 也 很 重要 。 正 如 在 连续 电压 的 真实 世界 中 通信 时 需要 模拟 电路 一 样 。 此 外 ， 对 异步 电路 的 研 
究 继续 产生 一 些 有 趣 的 知识 ， 其 中 的 一 些 也 将 有 利于 改进 同步 电路 。 


3.4 有限 状 态 机 


同步 时 序 电 路 可 以 用 图 3-22 中 的 形式 来 描述 。 这 些 形式 称 为 有 限 状 态 机 (Finite State Ma- 
chine，FSM) 。 这 个 名 字源 于 具有 位 寄存 器 的 电路 可 以 处 于 2 种 状态 中 的 某 一 种 唯一 状态 。 
一 个 有 限 状 态 机 有 M 个 输入 、Y 个 输出 和 上 大 位 状态 。 它 还 接收 一 个 时 钟 信号 和 一 个 可 选择 的 复 
位 信号 。 有 限 状 态 机 包含 两 个 组 合 逻 辑 块 ， 下 一 个 状态 逻辑 (next state logic) 和 输出 逻辑 (output 
logic) ， 以 及 一 个 存储 这 个 状态 的 寄存 器 。 在 每 一 个 时 钟 沿 ， 有 限 状态 机 进入 下 一 个 状态 ， 这 
个 下 一 个 状态 是 根据 当前 状态 和 输入 计算 出 来 的 。 根 据 有 限 状态 机 功能 规范 的 描述 ，FSM 通常 
分 为 两 类 。 在 Moore 型 有 限 状态 机 中 ， 输 出 仅仅 取决 于 机 器 的 当前 状态 。 在 Mealy 型 有 限 状 态 
机 中 ， 输 出 取决 于 当前 状态 和 当前 输入 。 有 限 状 态 机 提供 了 系统 的 方法 来 设计 给 定 功能 规范 的 
同步 时 序 逻 辑 电路 。 本 章 的 后 续 部 分 将 从 一 个 例子 开始 介绍 这 种 方法 。 





b ) Mealy 型 有 限 状 态 机 
图 3-22 有 限 状 态 机 


3. 4.1 有 限 状 态 机 设计 实例 

为 了 解释 有 限 状 态 机 的 设计 ， 考 虑 在 校园 中 繁忙 的 十 字 路 口 建 立 一 个 交通 灯 控 制 副 。 工 程 
系 学 生 在 宿舍 和 实验 室 之 间 的 Academic 大 街 上 漫步 。 他 们 正在 阅读 关于 有 限 状 态 机 的 教科 书 ， 
而 没有 看 他 们 前 面 的 路 。 足 球 运动 员 正 喧 嘻 地 拥挤 在 运动 场 和 食堂 之 间 的 Bravado 大 道上 。 他 
们 正在 向 前 和 向 后 投球 ， 也 没有 看 他 们 前 面 的 路 。 在 两 条 大 道上 的 十 字 路 口 发 生 了 一 些 严 重 的 
事故 。 为 了 防止 事故 再 次 发 生 ， 系 主任 要 求 Ben 安装 一 个 交通 灯 。 

Ben 决定 用 有 限 状态 机 来 解决 这 个 问题 。 他 分 别 在 Academic 大 道 和 Bravado 大 道上 安装 了 
2 个 交通 传感器 7T, 和 7T,。 当 某 个 传感器 上 输出 TRUE 时 ， 表 示 此 大 道上 有 学 生出 现 ; 当 输 出 
FALSE 时 ， 表 示 大 道上 没有 人 。 了 Ben 又 安装 了 2 个 交通 灯 忆 和 来 控制 交通 。 每 个 灯 接 收 数字 
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信号 输入 来 确定 显示 绿色 、 黄 色 或 红色 。 所 以 ， 有限 状态 机 有 7T、 和 752 A, LA L2 个 输 
出 。 十 字 路 口 的 灯 和 传感器 如 图 2 - 23 所 示 。Ben 采用 了 一 个 周期 为 5 秒 的 时 钟 。 在 每 一 个 时 
钟 周期 (上 升 沿 ) ， 灯 将 根据 交通 传感器 来 改变 。 同 时 ，Ben 还 设计 了 一 个 复位 按键 这 样 技术 人 员 
可 以 在 打开 交通 灯 时 将 控制 锅 设 置 为 一 个 已 知 的 初始 状态 。 状 态 机 的 黑 盒 视 图 如 图 3-24 所 示 。 





Academic == Ch 交通 灯 


T, 
oE T, 控制 器 

A 运动 场 
复位 


图 3-23 校园 地 图 图 3-24 有 限 状 态 机 的 墨盒 视图 

Ben 的 第 二 步 是 画 出 状态 转换 图 (state transition 
diagram) ， 如 图 3-25 所 示 。 状 态 转换 图 说 明 系 统 中 的 每 
一 个 可 能 的 状态 和 两 个 状态 之 间 的 转换 。 当 系统 复位 时 ， 
Academic 大 道上 的 灯 是 绿色 ，Bravado 大 道上 的 灯 是 红 
色 。 每 5 秒 ， 控 制 器 检查 交通 模式 并 决定 下 一 步 该 如 何 
处 理 。 只 要 Academic 大 道 有 交通 ， 灯 就 不 改变 。 当 Aca- 
demic 大 道上 没有 交通 时 ， 该 大 道上 的 灯 变 成 黄色 并 保 
持 5 秒 ， 然 后 再 变 成 红色 ， 同 时 Bravado 大 道上 的 灯 变 成 
绿色 。 同 样 ， 只 要 Bravado 大 道上 有 交通 ， 此 大 道上 的 
灯 保 持 绿 色 ， 然 后 变 成 黄色 ， 最 后 变 成 红色 。 

在 状态 转换 图 中 ,圆圈 代表 状态 ， 圆 弧 代 表 两 个 状 
态 之 间 的 转换 。 转 换 发 生 在 时 钟 上 升 沿 。 因 为 时 钟 总 是 图 3-25 ”状态 转换 图 
出 现在 同步 时 序 逻 辑 电 路 中 ， 所 以 只 根据 状态 转换 图 中 发 生 状 态 转换 的 位 置 来 控制 何 时 发 生 状 
态 转 换 。 而 且 当 转换 出 现时 ， 时 钟 只 简单 控制 ， 而 状态 转换 图 指出 哪里 发 生 了 转换 。 标 有 Re- 
set 从 外 部 进入 状态 SO 的 弧 说 明 不 管 当 前 状态 是 什么 ， 复 位 时 系统 都 应 该 进入 状态 S0。 如 果 一 
个 状态 有 多 个 离开 它 的 弧 ， 则 这 些 弧 标 有 触发 每 个 状态 转换 的 输入 条 件 。 例 如 ， 在 状态 SO, 
如 果 7 了 为 TRUE， 则 系统 将 保持 当前 状态 ; 如 果 7T, 为 FALSE， 则 转换 为 状态 S1。 如 果 一 个 状态 
只 有 一 个 离开 它 的 弧 ， 则 不 管 输入 是 什么 ， 转 换 都 会 发 生 。 例 如 ， 在 状态 S1， 系 统 将 总 是 转换 到 
状态 532。 在 特定 状态 下 的 输出 值 也 在 状态 中 给 出 。 例 如 ， 在 状态 S2，L, 是 红色 上 且 LERE. 

Ben 将 状态 转换 图 重 写 为 状态 转换 表 ( state transition table) ， 如 表 3-1 所 示 。 状 态 转换 表 说 
明 对 于 每 一 个 状态 和 输入 值 ， 应 该 产生 的 下 一 个 状态 5' 是 什么 。 注 意 ， 该 表 中 使 用 了 无 关 项 
(X) ， 无 关 项 表示 下 一 个 状态 不 依赖 于 特定 的 输入 。 还 要 注意 ， 该 表 省 略 了 复位 (Reset) 。 另 
外 ， 可 以 使 用 带 复 位 功能 的 触发 器 使 复位 后 总 是 进入 状态 SO0 ， 而 不 用 考虑 输入 。 





表 3-1 
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状态 转换 图 是 抽象 的 ， 因 为 它 使 用 了 状态 标记 |S0，S1，S2，S3| 和 输出 标记 | 红色 ， 黄 
色 ， 绿 色 | 。 为 了 建立 一 个 真实 的 电路 ， 状 态 和 输出 必须 按照 二 进 制 编码 。Ben 选择 了 人 简单 的 
编码 方式 ， 如 表 3-2 HK 3-3 所 示 。 每 个 状态 和 每 个 输出 都 编码 成 2 位 : Sra Pty tl Bago 


表 3-2 状态 编码 表 3-3 输出 编码 
状态 Si:0 的 编码 输出 Li.o 的 编码 
= = 绿色 00 
S2 10 黄色 
S3 11 红色 10 


Ben 更 新 状态 转换 表 来 使 用 这 些 二 进 制 编码 ， 如 表 3-4 所 示 。 这 个 改进 的 状态 转换 表 是 一 
个 说 明 下 一 个 状态 逻辑 的 真 值 表 。 它 根据 当前 状态 S 和 输入 来 定义 下 一 个 状态 S 。 


表 3-4 用 二 进 制 编码 的 状态 转换 表 
当前 状态 下 一 个 状态 


< 
ea 
~ 
w 
N 
wy 
© 


Se O Ka ES 
a 
~~ eM xx- o 
S = OS pd d pa 
O O = Oo O m= 


通过 这 些 表 ， 可 以 直接 读 出 用 与 或 式 表示 的 下 一 个 状态 的 布尔 表达 式 。 
Ss’, = 8,8, + 5, 8, T, + 8, Sols 
Br E ES T 
这 些 等 式 可 以 用 卡 诺 图 来 化 简 , 但 是 使 用 观察 方法 来 化 简 更 容易 。 例 如 ， 在 5! 等 式 中 的 
7, 和 7T, 项 明显 是 多 余 的 。 所 以 5! 可 以 化 简 成 一 个 异 或 运算 。 式 (3-2) 给 出 了 化 简 的 下 一 个 状态 
方程 。 


(3-1) 


S=” OS, 
SS, SeT, 43) Sa Te 
同样 Ben 针对 每 一 个 状态 指出 的 输出 写 出 了 输出 表 ， 如 表 3-5 所 示 。 也 可 以 直接 读 出 并 
化 简 这 些 输出 的 布尔 表达 式 。 例 如 ， 仅 仅 在 S, TRUE WIT, Lua X TRUE, 


» (3-2) 


R 3-5 输出 表 
当前 状态 输出 

Sı EPE YEARN eee ee Ln Lno 
0 0 0 
0 0 0 
1 ] 0 
1 1 l 

Ly = s, 

Lig = 5150 (3-3) 

Ly = Sı 

Lay = SS 
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最 后 ，Ben 以 图 3-22a 的 形式 绘制 了 Moore 型 有 限 状 态 机 的 电路 图 。 首 先 ， 画 了 一 个 2 位 
状态 寄存 器 ， 如 图 3-26a 所 示 。 在 每 个 时 钟 沿 ， 这 个 状态 寄存 器 复制 下 一 个 状态 So 到 状态 
Soo 在 启动 时 这 个 状态 寄存 器 收 到 一 个 同步 或 异步 复位 信号 来 初始 化 有 限 状 态 机 。 然 后 ， 根 
据 式 (3-2) 画 出 下 一 个 状态 逻辑 的 电路 图 ， 这 部 分 逻辑 根据 当前 状态 和 输入 计算 下 一 个 状态 ， 
如 图 3-26b 所 示 。 最 后 ， 根 据 式 (3-3) 画 出 输出 逻辑 的 电路 图 ， 这 部 分 逻辑 根据 当前 状态 计算 
输出 ， 如 图 3-26c 所 示 。 





输入 下 一 个 状态 逻辑 状态 寄存 器 
b) 








输入 F 一 个 状态 逻辑 状态 寄存 器 输出 逻辑 ”输出 
c) 
图 3-26 交通 灯 控 制 器 的 状态 机 电路 


图 3-27 给 出 了 一 个 用 于 解释 经 过 一 系列 状态 转换 的 交通 灯 控 制 器 的 时 序 图 。 图 中 显示 了 
CLK, Reset, A TIM Ta 、 下 一 个 状态 $ 和 当前 状态 S. Hh LLA Leo MARHA TAHR., 
例如 ， 当 前 状态 的 改变 导致 输出 的 改变 ， 输 入 的 改变 导致 下 一 个 状态 的 改变 。 虚 线 表 示 当 状态 
改变 时 CLK 的 上 升 沿 。 

时 钟 周期 是 5 秒 ， 所 以 交通 灯 最 多 每 5 秒 改变 一 次 。 当 这 个 有 限 状 态 机 第 一 次 启动 ， 它 的 
状态 是 未 知 的 ， 如 图 3-27 中 的 问号 所 示 。 所 以 系统 应 该 复位 到 一 个 已 知 状 态 。 在 这 个 时 序 图 
中 ,5 立即 复位 成 5$,， 这 说 明 使 用 了 带 复位 功能 的 异步 触发 器 。 在 状态 S, IT LERE, 1T 
LELIE., 

在 此 例 中 ， 复 位 后 Academic 大 道上 已 经 有 交通 。 所 以 ， 控 制 器 保持 在 状态 So， 并 保持 灯 
LÆRE, BE Bravado 大 道上 有 交通 到 达 并 开始 等 待 。15 PG, Academic 大 道上 的 交通 都 通 
过 了 ,7T, 开 始 下降 。 在 随后 的 时 钟 沿 ， 控 制 器 进入 状态 S,, ， 灯 到 变 成 黄色 。 在 下 一 个 5 秒 后 ， 
控制 器 进入 状态 5,， 灯 工 , 变 成 红色 ， 灯 Ls, 变 成 绿色 。 控 制 器 在 状态 S 上 等 待 ， 直 到 Bravado 
大 道上 的 交通 都 通过 了 。 然 后 它 进 入 状态 5; ， 灯 L, 变 成 黄色 。5 秒 后 ,控制 器 进入 状态 Sv， 灯 
L, 变 成 红色 ， 灯 L 变 成 绿色 。 这 个 过 程 重复 进行 。 


起 .= S. 


| 周期 1 | 周期 2 | 周期 3 | 周期 4 | 周期 5 ; 周期 6 | 周期 7 ; 周期 8 ; 周期 9 周期 10 | 
E Fe ee ee ee ae Pee ey er ae 


ee e e 
‘eae 


Sho 1? Aa EE — san ae Set pat — tS S, (01) 
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3.4.2 状态 编码 


在 前 面 的 例子 中 ,任意 选择 状态 和 输出 编码 。 不 同 的 选择 将 产生 不 同 的 电路 。 一 个 自然 
而 然 的 问题 是 ， 如 何 确 定 一 种 编码 ， 使 之 能 产生 一 个 逻辑 门 数 最 少 且 传播 延迟 最 短 的 电路 。 
不 幸 的 是 ， 没 有 一 种 简单 方法 可 以 找 出 最 好 的 编码 ， 除 了 尝试 所 有 的 可 能 情况 , 但 当 状 态 
数 很 大 时 这 也 是 不 可 行 的 。 然 而 ， 经 常 可 以 通过 观察 使 相关 状态 或 输出 共享 某 些 位 以 便 选 
择 一 种 好 的 编码 方式 。 计 算 机 辅助 设计 (CAD) 工 具 擅长 寻找 可 能 的 编码 集合 并 选择 一 种 合 
理 的 编码 。 

状态 编码 中 的 一 个 重要 决策 是 选择 二 进 制 编码 还 是 选择 独 热 编码 。 交 通 灯 控 制 器 例子 中 使 
用 了 二 进 制 编码 (binary encoding) ， 其 中 一 个 二 进 制 数 代表 一 种 状态 。 因 为 log,K 位 可 以 表示 天 
个 不 同 的 二 进 制 数 ， 所 以 有 天 个 状态 的 系统 只 需要 log,K 位 状态 。 

在 独 热 编码 (one-hot encoding) 中 ， 状 态 的 每 一 位 表示 一 种 状态 。 它 称 为 独 热 编码 ， 因 为 在 
任何 时 候 只 有 一 位 是 “ 热 的 ”或 TRUE。 例如， 一 个 有 3 个 状态 的 有 限 状态 机 的 独 热 编码 为 
001, 010 和 100。 状 态 的 每 一 位 存储 在 一 个 触发 器 中 ， 所 以 独 热 编码 比 二 进 制 编码 需要 更 多 的 
触发 器 。 然 而 ,使 用 独 热 编码 ， 下 一 个 状态 和 输出 钦 辑 通常 更 简单 ， 需 要 的 门 电路 也 更 少 。 最 
佳 编码 方式 取决 于 具体 的 有 限 状 态 机 。 

有 限 状 态 机 状态 编码 

N 分 频 计数 器 有 一 个 输出 ， 没 有 输入 。 每 循环 N 个 时 钟 后 ， 输 出 了 产生 一 个 周期 的 高 电 平 
信号 。 换 句 话 说 ,输出 是 时 钟 的 入 分 频 。3 分 频 计数 器 的 波形 和 状态 转换 图 如 图 3-28 所 示 。 使 


用 二 进 制 编码 和 独 热 编码 画 出 这 个 计数 器 的 电路 设计 。 
复位 
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解 : K 3-6 和 表 3-7 给 出 了 编码 前 抽象 状态 转换 表 和 输出 表 。 


表 3-6 3 分 频 计 数 器 状态 转换 表 表 3-7 3 分 频 计 数 器 输出 表 
当前 状态 下 一 个 状态 当前 状态 输出 
So S, So 1 
S, S, S, 0 
S i S 0 


表 3-8 比较 了 3 个 状态 的 二 进 制 编码 和 独 热 编 码 。 


表 3-8 3 分 频 计 数 器 的 二 进 制 编码 和 独 热 编码 
状态 二 进 制 编码 


| 
a 0 0 l 0 0 
y 0 1 0 0 I 
S, 1 0 0 1 0 
二 进 制 编码 使 用 2 位 状态 。 使 用 这 种 编码 ， 状 态 转换 表 如 表 3-9 所 示 。 注 意 ， 这 里 没有 输 


入 ,下 一 个 状态 只 取决 于 当前 状态 。 输 出 表 作 为 练习 留 给 读者 完成 。 下 一 个 状态 和 输出 的 等 
式 是 : 


S 1 = S 
(3-4) 
SoS, Se 
Y = S, S, (3-5) 
3-9 二进制 编码 的 状态 转换 表 
当前 状态 下 一 个 状态 
S, So s Si 
0 0 0 1 
0 1 1 0 
1 0 0 0 


独 热 编 码 使 用 3 位 状态 。 这 种 编码 的 状态 转换 表 如 表 3-10 所 示 ， 输 出 表 作为 练习 留 给 读 
者 完成 。 下 一 个 状态 和 输出 的 等 式 是 : 


S T S, 
S',=S, (3-6) 
S'o = S, 
Y=S, 7 (3-7) 
323-10 独 热 编码 的 状态 转换 表 
当前 状态 下 一 个 状态 

S, S So s g 3 

0 0 ] 0 1 0 

0 1 0 1 0 0 

l 0 0 0 0 1 


图 3-29 给 出 了 每 一 种 设计 的 原理 图 。 注 意 ， 可 以 优化 二 进 制 编码 设计 的 硬件 来 共享 A 
So 的 相同 门 电 路 。 同 样 ， 独 热 编码 设计 需要 带 可 置 位 (*) 和 可 复位 (r) 功 能 的 触发 器 在 复位 时 
对 状态 机 的 So 进行 初始 化 。 最 好 的 实现 选择 取决 于 门 电 路 和 触发 器 的 相对 成 本 ， 但 在 这 个 特 
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定 的 例子 中 独 热 编码 设计 更 可 取 。 < 


CLK 





复位 





下 一 个 状态 逻辑 状态 寄存 器 输出 逻辑 输出 
a) 二 进 制 编码 b ) 独 热 编码 
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一 种 相关 的 编码 方式 是 独 冷 编 码 ， 在 这 方式 中 用 天 位 表示 天 个 状态 ， 其 中 的 一 位 恰好 
FALSE, 


3.4.3 Moore 型 状态 机 和 Mealy 型 状态 机 


迄今 为 止 ， 我 们 已 经 介绍 了 Moore 型 状态 机 的 例子 ， 它 的 输出 只 取决 于 系统 的 状态 。 因 
此 ， 在 Moore 型 状态 机 的 状态 转换 图 中 ， 输 出 被 标记 在 圆圈 内 。Mealy 型 状态 机 和 Moore 型 
状态 机 很 相似 ， 但 是 输出 取决 于 输入 和 当前 状态 。 因 此 ， 在 Mealy 型 状态 机 的 状态 转换 表 
中 ， 输 出 被 标记 在 弧 上 而 不 是 圆圈 内 。 使 用 输入 和 当前 状态 计算 输出 的 组 合 逻 辑 框图 ， 如 
图 3-22b 所 示 。 

Moore 型 状态 机 与 Mealy 型 状态 机 

Alyssa P. Hacker 有 一 个 带 限 状 态 机 大 脑 的 宠物 机 器 蜗牛 。 蜗 牛 沿 着 纸 带 从 左 向 右 爬 行 ， 这 
个 纸 带 包含 1 和 0 的 序列 。 在 每 一 个 时 钟 周 期 ， 蜗 牛 爬 行 到 下 一 位 。 蜗 牛 从 左 到 右 在 纸 带 上 有 怜 
行 ， 当 最 后 经 过 的 2 位 是 01 时 ， 蜗 牛 会 高 兴 得 笑 起 来 。 设 计 一 个 有 限 状 态 机 来 计算 蜗牛 何 时 
会 笑 。 输 入 4 是 蜗牛 触角 下 面 的 位 。 当 蜗牛 笑 时 ,输出 了 为 TURE。 比 较 Moore 型 状态 机 和 
Mealy 型 状态 机 的 设计 。 画 出 包含 输入 、 状 态 和 输出 的 每 种 机 器 的 时 序 图 ， 蜗 和 牛 的 疏 行 序列 
是 0100110111 。 

解 : Moore 型 状态 机 需要 3 个 状态 ， 如 图 3-30a 所 示 。 确 信 你 自己 的 状态 转换 图 是 正确 的 。 
特别 是 ， 当 输入 为 0 时 ， 为 什么 从 $ 到 S, 有 一 条 弧 ? 

与 Moore 型 状态 机 相 比 ，Mealy 型 状态 机 只 需要 2 个 状态 ， 如 图 3-30b 所 示 。 每 一 个 弧 被 标 
记 为 44Y。4 是 引起 转换 的 输入 , Y 是 相应 的 输出 。 





a ) Moore 型 有 限 状态 机 b) Mealy 型 有 限 状 态 机 
3-30 有 限 状 态 机 状态 转换 图 


表 3-11 和 表 3-12 给 出 了 Moore 型 状态 机 的 状态 转换 图 和 输出 表 。Moore 型 状态 机 至 少 需要 
2 位 状态 。 考 虑 使 用 以 下 二 进 制 状态 编码 : Se =00. S, =O01, S,=10, 423-13 和 表 3-14 重新 写 
出 了 用 二 进 制 状态 编码 的 状态 转换 表 和 输出 表 。 
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% 3-11 Moore 型 有 限 状 态 机 的 状态 转换 表 


当前 状态 输入 下 一 个 状态 当前 状态 输入 下 一 个 状态 
S A Vy S A S” 
So 0 Sı Sı l Sz 
So 1 So S 0 Sı 
S, 0 S; Sz ] So 


% 3-12 Moore 型 有 限 状 态 机 的 输出 表 


当前 状态 
S 


So 
S, 
S2 


=- o ojx Ž 


表 3-13 用 二 进 制 状态 编码 的 Moore 型 有 限 状态 机 的 状态 转换 表 
下 一 个 状态 


< 
| 
N 
i 


= = © O O O&O 
O O = m © Ọ 
O O = O O © 
O m © m= Ọ = 


R 3-14 用 二 进 制 状态 编码 的 Moore 型 有 限 状 态 机 的 输出 表 
当前 状态 输出 

SI So 
0 0 


一 Oo oj 


l 


通过 这 些 表 ， 可 以 找 出 下 一 个 状态 和 输出 。 注 意 ， 使 用 状态 11 不 存在 这 个 事实 ， 可 以 进 
一 步 化 简 这 些 等 式 。 因 此 ， 不 存在 状态 所 对 应 的 下 一 个 状态 和 输出 是 无 关 项 (在 表 中 没有 显 
示 )。 我 们 使 用 无 关 项 来 最 小 化 等 式 。 

S' = SA 
S =A 
Fes (3-9) 

K 3-15 给 出 了 Mealy 型 状态 机 的 状态 转换 表 和 输出 表 。Mealy 型 状态 机 只 需要 1 位 状态 。 
考虑 使 用 二 进 制 状态 编码 : Se =0，5, =1。 表 3-16 重新 写 出 了 用 二 进 制 状态 编码 的 状态 转换 表 
和 输出 表 。 


(3-8) 


R 3-15 Mealy 型 状态 机 的 状态 转换 表 和 输出 表 








从 这 些 表 中 ， 可 以 通过 观察 找到 下 一 个 状态 和 输出 等 式 。 
S =A (3-10) 
Y=S,A (3-11) 
Moore 型 状态 机 和 Mealy 型 状态 机 的 电路 原理 图 如 图 3-31 所 示 。 每 种 状态 机 的 时 序 图 如 
图 3-32 所 示 。 两 种 状态 机 的 状态 序列 不 同 。 然 而 ，Mealy 型 状态 机 的 输出 上 升 要 早 一 个 周期 。 
这 是 因为 它 的 输出 直接 响应 输入 ， 而 不 需要 等 待 状态 的 变化 。 如 果 Mealy 型 状态 机 的 输出 通过 
触发 器 产生 延迟 ， 那 么 它 的 输出 将 与 Moore 型 状态 机 一 样 。 在 选择 有 限 状 态 机 设计 类 型 时 ， 需 
要 考虑 何 时 需要 到 输出 啊 应 。 





a ) Moore 型 状态 机 b ) Mealy 型 状态 机 
3-31 有 限 状 态 机 的 电路 原理 图 
;周期 1 Rigi ongf sapi 周期 5 | Pai ie 周期 8 | 周期 9 | bos id 周期 1 
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图 3-32 Moore 型 状态 机 和 Mealy 型 状态 机 的 时 序 图 < 
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3.4.4 状态 机 的 分 解 


如 果 可 以 将 复杂 的 有 限 状 态 机 分 解 成 多 个 互相 作用 的 更 简单 的 状态 机 ， 使 得 其 中 一 些 状态 
机 的 输出 是 另 一 些 状 态 机 的 输入 ， 则 设计 复杂 的 有 限 状 态 机 经 常 是 很 容易 的 。 这 种 应 用 层次 化 
和 模块 化 的 方法 称 为 状态 机 的 分 解 (factoring) 。 

不 分 解 的 状态 机 和 分 解 后 的 状态 机 

修改 3.4. 1 节 中 的 交通 灯 控 制 器 ， 增 加 一 个 游行 模式 。 当 观 
众 和 乐队 以 分 散 的 队 形 漫步 到 足球 比赛 时 就 进入 游行 模式 ， 此 时 
保持 Bravado 大 道上 的 灯 是 绿色 。 控 制 器 增加 两 个 新 的 输入 : 已 和 
R, P 保持 至 少 一 个 周期 有 效 以 便 进入 游行 模式 ，R 保持 至 少 一 个 
周期 以 便 退 出 游行 模式 。 当 处 于 游行 模式 中 时 ， 控 制 句 按照 平常 
的 时 序 运行 直 到 L, 变 成 绿色 ， 然 后 保持 Ls 为 绿色 直到 游行 模式 
结束 。 

首先 ， 画 出 单个 有 限 状 态 机 的 状态 转换 图 ， 如 图 3-33a 所 示 。 
然后 ， 画 出 2 个 相互 作用 的 有 限 状 态 机 的 状态 转换 图 ， 如 图 3-33b 
所 示 。 当 处 于 游行 模式 时 ， 模式 有 限 状 态 机 的 输出 M 为 有 效 。 灯 
有 限 状 态 机 根据 M 和 交通 传感器 (7T, 和 7 ) 来 控制 灯 的 颜色 。 

解 : 图 3-34a 给 出 了 单个 有 限 状 态 机 的 设计 。 状 态 S ~ 状态 
S, 处 于 普通 模式 。 状 态 $, ~ 状态 S, 处 于 游行 模式 。 这 两 个 部 分 基 
本 相同 ， 但 在 游行 模式 下 ， 有 限 状 态 机 保持 在 状态 Se, IERT Bra- 
vado 大 道上 的 灯 为 绿色 。 输 入 P 和 RR 控制 在 两 个 部 分 之 间 的 移动 。 
有 限 状 态 机 设计 很 杂乱 。 图 3-34b 显示 了 分 解 设计 后 的 有 限 状 态 
机 。 模 式 有 限 状态 机 有 2 种 状态 来 ， 它们 用 来 跟踪 处 于 普通 模式 


b ) 分 解 为 两 个 状态 机 
或 游行 模式 的 灯 。 当 MM 为 TRUE 时 ， 灯 有 限 状态 机 将 修改 为 保持 ai 
sg q 图 3-33 修改 后 的 交通 灯 控 


til ae A PR AR AS BL AY 








a) 未 分 解 的 
图 3-34 ”状态 转换 图 
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b ) 分 解 后 的 
图 3-34 (4%) a 


3.4.5 由 电路 图 导出 状态 机 


由 电路 图 推导 出 状态 转换 图 采用 几乎 与 有 限 状态 机 设计 相反 的 过 程 。 这 个 过 程 是 有 必要 
的 ， 如 当 承 担 一 个 没有 完整 文档 的 项 目 或 者 开展 基于 他 人 系统 的 逆向 工程 。 
。 检查 电路 ， 标 明 输 入 、 输 出 和 状态 位 。 
写 出 下 一 个 状态 和 输出 等 式 。 
创建 下 一 个 状态 和 输出 表 。 
删除 不 可 达 状 态 来 简化 下 一 个 状态 表 。 
给 每 个 有 效 状态 位 组 合 指定 状态 名 称 。 
用 状态 名 称 重 写 下 一 个 状态 和 输出 表 。 
画 出 状态 转换 图 。 
。 使 用 文字 阐述 有 限 状 态 机 的 功能 。 
在 最 后 一 步 ， 注 意 简 洁 地 描述 有 限 状态 机 的 主要 工作 目标 和 功能 ， 而 不 是 简单 地 重 述 状态 
go 
从 电路 导出 有 限 状 态 机 


not Hacker 家 门 的 键盘 锁 已 经 重 装 ， 因 此 她 的 旧 密 码 不 再 有 效 。 新 键盘 锁 的 电路 图 如 
图 3-35 Bras. Alyssa 认为 这 个 电路 可 能 是 一 个 有 限 状 态 机 ， 她 浴 定 从 该 电路 图 推导 出 状态 转换 
图 来 看 看 是 否 可 以 打开 门 锁 。 

fit: Alyssa 首先 检查 电路 。 输 入 是 41.。 ， 输 出 是 
Unlock( 开锁 )。 图 3-35 已 经 标 出 了 状态 位 。 因 为 电路 
的 输出 只 取决 于 状态 位 ， 所 以 这 是 一 个 Moore 型 状态 
机 。 根 据 这 个 电路 ，Alyssa 直接 写 出 该 下 一 个 状态 和 
输出 等 式 : 


S = S, A, Ay 
S', = S, S, A,A, (3-12) 
Unlock = S, 

接 下 来 ， 根 据 式 (3-12) 她 写 出 下 一 个 状态 和 输出 图 3-35 例 3.9 中 找到 的 有 限 状 态 机 的 电路 
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K, WK 3-17 和 表 3-18 所 示 。 她 首先 根据 式 (3-12) 标 记 表 中 取 值 为 1 的 位 置 ， 其 余 位 置 标记 
为 0。 


表 3-17 从 图 3-35 导出 的 下 一 个 状态 表 


当前 状态 下 一 个 状态 
S; So A, Ay Si So 
0 0 0 0 0 0 
0 0 0 ] 0 0 
0 0 ] 0 0 0 
0 0 l 1 0 ] 
0 1 0 0 0 0 
0 l 0 1 1 0 
0 1 l 0 ` 0 0 
0 l l 1 0 0 
] 0 0 0 0 0 
l 0 0 ] 0 0 
] 0 ] 0 0 0 
] 0 ] 1 0 0 
1 1 0 0 0 0 
] 1 0 l l 0 
1 l 1 0 0 0 
l l ] 1 0 0 





然后 ， 通 过 删除 未 使 用 的 状态 并 利用 无 关 项 来 合 表 3-18 ”从 图 3-35 导出 的 输出 表 
并 行 等 方法 Alyssa 简化 了 表 。 状 态 S。= 11 从 未 在 
表 3-17 中 作为 可 能 的 下 一 个 状态 出 现 过 ， 因 此 以 这 
个 状态 作为 当前 状态 的 行 都 可 以 删除 。 对 于 当前 状态 
Sio =10,， 下 一 个 状态 总 是 51.。= 00， 与 输入 无 关 ， 因 
此 在 表 中 对 应 的 输入 用 无 关 项 代替 。 简 化 的 真 值 表 如 
表 3-19 和 表 3-20 所 示 。 





表 3-19 简化 的 下 一 个 状态 表 





当前 状态 下 一 个 状态 
Sı So k ee de si So 
0 0 0 0 0 0 
0 0 0 l 0 0 
0 0 1 0 Oy »’ 0 
0 0 l 1 0 1 
0 1 0 0 0 0 
0 ] 0 l l 0 
0 1 1 0 0 0 
0 1 1 l 0 0 
l 0 X X 0 0 
R 3-20 简化 的 输出 表 
当前 状态 输出 
S, So Unlock 
0 0 


© 
O == © 
© 
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Alyssa 为 每 个 状态 位 组 合 取 名 : S, HES, =00, S, HES, =01, S, 是 $,。= 10。 表 3-21 和 
表 3-22 展 示 了 使 用 状态 名 的 下 一 个 状态 表 和 输出 表 。 


表 3-21 符号 化 的 下 一 个 状态 表 





Alyssa 使 用 表 3-21 和 表 3-22 画 出 图 3-36 所 示 的 状态 转换 图 。 
通过 观察 状态 转换 图 ， 她 知道 该 有 限 状 态 机 的 工作 原理 : 该 状态 
机 只 有 在 检测 到 输入 值 4 是 一 个 3 跟着 一 个 1 后 就 会 将 门 解锁 。 
然后 门 再 次 锁 上 。Alyssa 尝试 在 门 锁 键 盘 上 输入 该 数字 串 ， 成 功 
将 门 打开 。 < 


3.4.6 有限 状 态 机 小 结 


有 限 状态 机 是 根据 给 定 规范 系统 设计 时 序 电 路 的 非常 有 用 方 
法 。 设 计 有 限 状 态 机 的 步骤 如 下 : 
o 确定 输入 和 输出 。 
。 画 状态 转换 图 。 
e 对 于 Moore 型 状态 机 : 
a 写 出 状态 转换 表 。 
a 写 出 输出 表 。 
© 对 于 Mealy 型 状态 机 
e 写 出 组 合 的 状态 转换 表 和 输出 表 。 
© 选择 状态 编码 一 一 这 个 选择 将 影响 硬件 设计 。 
© 为 下 一 个 状态 和 输出 逻辑 写 出 布尔 表达 式 。 





。 画 出 电路 草图 。 
本 书 将 反复 使 用 有 限 状 态 机 来 设计 复杂 的 数字 系统 。 
图 3-36 例 3.9 的 有 限 状态 机 
3.5 时 序 逻 辑 的 时 序 的 状态 转换 图 


我 们 知道 ， 触 发 器 在 时 钟 的 上 升 沿 将 输入 了 D 复制 到 输出 0。 这 个 过 程 称 为 在 时 钟 沿 对 D 采 
样 (sampling) 。 当 时 钟 上 升 时 ， 如 果 刀 是 0 或 1 的 稳定 状态 ， 则 这 个 动作 可 以 清晰 地 定义 。 但 
是 ， 如 果 D 在 时 钟 上 升 时 发 生 了 变化 ， 将 发 生 什 么 情况 ? 

这 个 问题 类 似 于 面 对 一 个 正在 捕捉 图 片 的 照相 机 。 设 想 这 样 一 个 图 片 ， 一 只 青蛙 正在 从 一 
个 睡莲 上 跳 入 湖水 中 。 如 果 你 在 青蛙 跳 之 前 拍照 ， 你 将 看 到 一 只 在 睡莲 上 的 青蛙 。 如 果 你 在 青 
峙 跳 之 后 拍照 ， 你 将 看 到 水 面 上 的 波纹 。 如 果 你 刚好 在 青蛙 跳 的 时 候 拍照 ， 你 将 看 到 一 只 伸展 
的 青蛙 从 睡莲 跳 人 湖水 的 模糊 影像 。 照 相机 由 孔径 时 间 (aperture time) 刻画 ， 在 此 时 间 内 一 个 
物体 必须 保持 不 动 ， 照 相机 才能 获得 清晰 的 图 像 。 同 样 ， 时 序 元 件 在 时 钟 沿 附 近 也 有 和 孔径 时 
间 。 在 孔径 时 间 内 输入 必须 稳定 ， 触 发 器 才能 产生 明确 定义 的 输出 。 

时 序 元 件 的 孔径 时 间 分 别 用 时 钟 沿 前 的 建立 时 间 (setup time) 和 时 钟 沿 后 的 保持 时 间 (hold 
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time) 定 义 。 正 如 静态 约束 限制 我 们 使 用 在 禁止 区 域外 的 逻辑 电 平 ， 动 态 约束 限制 我 们 使 用 和 孔 
径 时 间 处 改变 的 信和 号。 利用 动态 约束 ， 我 们 可 以 认为 时 间 是 基于 时 钟 周期 的 离散 单元 ， 正 如 我 
们 将 信号 电 平 认 为 是 离散 的 1 和 0。 一 个 信和 号 可 以 有 毛刺 ， 也 可 以 在 有 限时 间 内 反复 振荡 。 在 
动态 约束 下 ， 我 们 只 关心 时 钟 周期 结束 时 的 最 终 值 ， 之 后 它 设置 为 一 个 稳定 值 。 所 以 ,我 们 可 
以 简单 地 用 4[n] 表 示 在 第 nn 个 时 钟 周 期 结束 时 信号 A 的 值 ， 其 中 是 整数 ， 而 不 再 考虑 时 刻 e 
RE A(t), HP t EXX 

时 钟 周 期 应 该 足够 长 ， 以 便 使 所 有 信号 都 稳定 下 来 。 这 限制 了 系统 的 速度 。 在 真实 的 系统 
中 ， 时 钟 不 能 准确 地 同时 到 达 所 有 的 触发 器 。 这 个 时 间 变 量 称 为 时 钟 偏 移 (clock skew), iH 
一 步 增加 了 必要 的 时 钟 周 期 。 

在 面 对 真 实 的 世界 时 ， 动 态 约束 往往 是 不 可 能 的 满足 。 比 如 ， 考 虑 一 个 通过 按钮 输入 的 电 
路 。 一 只 猴子 可 能 在 时 钟 上 升 时 按 下 了 按钮 。 此 时 触发 器 捕获 了 一 个 0 ~ 工 之 间 的 值 ， 这 个 值 
不 可 能 稳定 到 一 个 正确 的 逻辑 值 ， 这 种 现象 称 为 亚 稳 态 。 解 决 这 种 异步 输入 的 方法 是 使 用 同步 
器 ， 同 步 器 产生 非法 逻辑 值 的 概率 非常 小 (但 是 不 为 0)。 

我 们 将 在 本 节 的 后 面 讨 论 这 些 问 题 。 


3.5.1 动态 约束 


到 目前 为 止 ， 我 们 将 重点 放 在 时 序 电 路 的 功能 规范 上 。 触 发 器 和 有 限 状 态 机 等 同步 时 序 电 
路 也 有 时 序 规范 ， 如 图 3-37 所 示 。 当 时 钟 上 升 时 ,输出 i 

在 时 钟 到 0 的 最 小 延迟 1 后 开始 改变 ， 并 在 时 钟 到 0 的 ”““ 
传播 延迟 4 内 达到 最 终 值 。 它 们 分 别 代 表 了 通过 电路 的 ”输出 @) 








最 快 和 最 慢 延 迟 。 为 了 电路 对 输入 正确 采样 ， 在 时 钟 上 ”输入 (s) XXXXIC NNN 
升 沿 到 来 前 ,输入 必须 在 建立 时 间 (setup time) 14. 内 保 ee | 
持 稳定 ， 在 时 钟 上 升 沿 后 ,输入 必须 保持 至 少 保持 时 间 ii si ran 
(hold time) tw 内 保持 稳定 。 建 立时 间 和 保持 时 间 统 称 为 PeT 


电路 的 孔径 时 间 (aperture time) ， 因 为 它 是 输入 保持 稳定 图 3-37 同步 时 序 电 路 的 时 序 规范 
状态 的 时 间 总 和 。 

动态 约束 ( dynamic discipline) 是 指 同步 时 序 电路 的 输入 必须 在 时 钟 沿 附 近 的 建立 和 维持 筷 
径 时 间 内 保持 稳定 。 为 了 满足 这 个 要 求 ， 必 须 保 证 在 触发 器 对 信号 进行 采样 时 ， 信 号 不 能 变 
化 。 因 为 在 采样 时 仅 关 心 输入 的 最 终 值 ， 所 以 可 以 将 信号 当 作 时 间 和 逻辑 电 平 上 都 是 离散 
的 量 。 


3.5.2 系统 时 序 


时 钟 周期 或 时 钟 时 间 Tc 是 重复 时 钟 信号 的 上 升 沿 之 间 的 时 间 。 它 的 倒数 人 = 1/T. 是 时 钟 频 
率 。 所 有 的 一 切 都 是 一 样 的 ， 提 高 时 钟 频率 可 以 增加 数字 系统 在 单位 时 间 内 完成 的 工作 量 。 频 
率 的 单位 是 Hz， 或 者 每 秒 的 周期 数 。1MHz = 10"Hz，1GHz = 10 Hz。 

3-38a 给 出 了 同步 时 序 电 路 中 一 条 普通 路 径 ， 我 们 希望 计算 它 的 时 钟 周 期 。 在 时 钟 的 上 
升 沿 ， 寄 存 器 RI 产生 输出 Q1。 这 些 信号 进入 一 个 组 合 逻 辑 电路 ， 产 生 D2 ， 作 为 寄存 器 R2 的 
输入 。 图 3-38b 的 时 序 图 说 明 每 个 输出 信号 在 它 的 输入 信号 发 生 改 变 后 开始 改变 一 个 最 小 延 
迟 ， 在 输入 信号 稳定 后 在 传播 延迟 内 输出 信号 稳定 到 最 终 值 。 灰 色 箭 头 表 示 通 过 RL MAR 
辑 块 的 最 小 延迟 ， 黑 色 箭 头 代 表 通 过 RI 和 组 合 逻 辑 的 传播 延迟 。 我 们 针对 第 二 个 寄存 器 R 
的 建立 时 间 和 保持 时 间 来 分 析 时 序 约束 。 
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图 3-38 ”寄存 器 之 间 的 路 径 和 时 序 图 


1. 建立 时 间 约 束 
图 3-39 只 显示 了 通过 路 径 的 最 大 延迟 的 时 序 图 , 用 箭 K CIK 
头 表示 。 为 了 满足 R2 的 建立 时 间 ，D2 必须 在 不 迟 于 下 一 个 “pa e PH 
时 钟 沿 之 前 的 建立 时 间 前 稳定 。 所 以 我 们 得 出 了 最 小 时 钟 周 。 ”Ri 


R2 
期 的 等 式 z a eee Ee >i 
r >t +t, +t, (3-13) CT ke) Roe 


在 商业 设计 中 ， 时 钟 周期 经 常 由 研发 总 监 和 市 场 部 提出 IDNE 
(以 确保 产品 的 竞争 性 ) 。 而 且 ， 制 造 商 确定 触发 器 时 钟 到 0 五- 二 一 -XXX 一 一 





的 传播 延迟 上 .和 建立 时 间 tepo 因此， 可 以 重 写 式 (3-13 ) Se Ke 

i EWA BY RK EIR, IIT IA He R RE 

控制 的 一 个 变量 。 图 3-39 ”建立 时 间 约 束 的 最 大 延迟 
E gs Lhe a (3-14) 


在 圆 括号 内 的 项 4。 +1.w 称 为 时 序 开销 (sequencing overhead) 。 理 想 状态 下 ， 整 个 周期 时 间 
7. 都 应 用 于 组 合 逻 辑 中 有 用 的 计算 ， 其 传播 延迟 为 tu。 但是， 触发 器 的 时 序 开 销 占 用 了 周期 时 
间 。 式 (3-14 ) 称 为 建立 时 间 约 束 (setup time constrain ) 或 最 大 延迟 约束 (max-delay constrain) ， 因 
为 它 取 决 于 建立 时 间 ， 并 限制 通过 组 合 逻辑 的 最 大 延迟 。 

如 果 通 过 组 合 逻 辑 的 传播 延迟 太 大 ，D2 有 可 能 在 R2 对 其 采样 时 不 能 稳定 到 它 的 最 终 值 。 
所 以 ，R2 可 能 采样 到 一 个 不 正确 的 结果 或 者 一 个 处 于 禁止 区 域 的 非法 电 平 。 在 这 种 情况 下 ， 
电路 将 出 现 故 障 。 解 决 这 个 问题 的 方法 有 两 个 : 增加 时 钟 周期 或 重新 设计 组 合 逻 辑 来 缩短 传播 
JER, 

2. 保持 时 间 约 束 CLK 

图 3-38a 中 的 寄存 器 R2 也 有 保持 时 间 约 束 。 寄 存 器 的 “| Qi D2 
输入 D2 必须 保持 不 变 直 到 某 些 时 间 4 在 时 钟 的 上 升 沿 之 
后 。 根 据 图 3-40， 在 时 钟 上 升 沿 之 后 只 要 !，++, ，D2 就 可 
能 变化 。 所 以 ， 我 们 可 以 得 到 

teq + ty Z brea (3-15) 

男 外 ,i 和 i 是 触发 器 的 属性 ， 通 常 不 能 被 设计 人 员 

控制 。 重 新 排列 上 式 ， 可 以 得 到 组 合 逻 辑 的 最 小 延迟 : 


beg = É hold s7 Vln (3- 16) 





CLK 
A 
R2 
i 
I 
1 
' 

I 
1 
' 

1 
1 
I 
I 
' 

' 


式 (3-16 ) 称 为 保持 时 间 约 束 或 最 小 延迟 约束 (min-delay con- i ine oat 

strain) ， 因 为 它 限制 了 通过 组 合 逻辑 的 最 小 延迟 。 图 3-40 ”保持 时 间 约束 的 最 小 延迟 
我 们 已 经 假定 任何 逻辑 元 件 都 可 以 互 连 而 不 会 导致 时 序 

问题 。 尤 其 是 ， 希 望 图 3-41 所 示 的 2 个 触发 器 可 以 直接 级 mn! 

联 ， 而 不 导致 保持 时 间 问 题 。 


在 此 情况 中 ， 因 为 在 触发 句 之 间 没 有 组 合 逻 辑 ， 所 以 ”图 3-41 背靠背 相连 的 触发 器 


Bt 7p a8 HF IF 85 


ta =0,. ttt A ZK (3-16) 7H : 
bhoid S Lecq (3-17) 

RL, —P A Se AC A RRT E He C AER ARE RAC AE ITH AY toa =0， 
于 是 式 (3-17) 总 是 可 以 满足 的 。 除 非特 别 注 明 处 ， 本 书 经 常 假定 和 忽略 保持 时 间 约 束 。 

然而 ， 保 持 时 间 约 束 又 非常 重要 。 如 果 它 们 不 能 得 到 满足 ， 则 唯一 的 解决 办 法 是 重新 设计 
电路 以 便 增 加 组 合 逻辑 的 最 小 延迟 。 与 建立 约束 不 同 ， 它 们 不 能 通过 调整 时 钟 周期 来 改正 。 以 
目前 的 科技 水 平 ， 重 新 设计 和 制造 一 个 集成 电路 需要 花费 数 月 时 间 和 上 千 万 美元 。 所 以 违反 保 
持 时 间 约 束 将 产生 非常 严重 的 后 果 。 

3， 小 结 

时 序 电 路 中 的 建立 时 间 和 保持 时 间 约 束 控制 触发 器 之 间 的 组 合 逻 辑 的 最 大 延迟 和 最 小 延 
迟 。 现 代 触 发 器 经 常设 计 为 可 以 使 其 组 合 逻 辑 的 最 小 延迟 是 0， 即 触发 器 可 以 背靠背 地 放置 。 
因为 高 的 时 钟 频率 意味 着 短 的 时 间 周 期 ， 所 以 最 大 延迟 约束 限制 了 高 速 电路 的 关键 路 径 上 串联 
门 的 个 数 。 

时 序 分 析 

Ben 设计 了 图 3-42 所 示 的 电路 。 根 据 他 所 使 用 组 件 的 数据 手册 ， 触 发 器 的 时 钟 到 0 的 最 
小 延迟 和 传播 延迟 分 别 位 30ps 和 80ps。 它 们 的 建立 时 间 和 保持 时 间 分 别 为 S0ps 和 60ps。 每 个 
逻辑 门 的 传播 延迟 和 最 小 延迟 分 别 为 40ps 和 25ps。 帮 助 Ben 确定 最 大 时 钟 周期 ， 并 确定 是 否 
能 满足 保持 时 间 约 束 。 这 个 过 程 称 为 时 序 分 析 (timing analysis) 。 


CLK CLK 





K 3-42 ”用 于 时 序 分 析 的 实例 电路 

解 : 图 3-43a 显示 了 信号 变化 时 的 波形 图 。 输 入 4 到 D 存储 在 寄存 器 中 ， 所 以 它们 只 在 
CLK 上 升 后 立刻 改变 。 

关键 路 径 出 现在 B=0、C=0、D=0, 且 4 从 0 上 升 为 1 时, 触发 nl LA, LER, YF 
he, WAN 3-43b 所 示 。 这 条 路 径 包 含 3 个 门 延迟 。 对 于 关键 路 径 ， 我 们 假定 每 一 个 门 都 需要 它 
全 部 的 传播 延迟 。 了 必须 在 下 一 个 时 钟 的 上 升 沿 到 来 前 建立 。 所 以 最 小 的 周期 时 间 是 

T, È tq + 3ta + tenp = 80 +3 x40 +50 = 250ps (3-18) 
最 大 时 钟 频率 是 人 = 1/T, =4GHz。 

当 4=0 且 C LAM, EARE, SX’ 上升 ， 如 图 3-43c 所 示 。 对 于 最 短路 径 ， 我 们 
假定 每 个 逻辑 门 仅 在 最 小 延迟 之 后 切换 。 这 条 路 径 只 包含 一 个 门 延 迟 ， 所 以 它 将 在 teg tty = 
30 +25 =55ps 之 后 出 现 。 但 是 ， 这 个 触发 器 需要 60ps 的 保持 时 间 ， 意 味 着 X 必须 在 时 钟 的 上 
升 沿 到 来 之 后 的 60ps 内 保持 稳定 ， 蕊 触发 器 才 可 以 可 靠 地 对 它 的 值 进 行 采样 。 在 这 种 情况 下 ， 
在 第 一 个 时 钟 的 上 升 沿 ，X' =0， 所 以 我 们 希望 触发 器 捕获 和 =0。 因 为 碟 不 能 保持 稳定 状态 足 
够 长 的 时 间 ， 所 以 下 的 实际 值 不 可 预测 。 这 个 电路 违反 了 保持 时 间 约 束 ， 且 任何 时 钟 频率 其 动 
作 都 可 能 不 正确 。 
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图 3-43 时序 图 4 


解决 违反 保持 时 间 约 束 问题 

Alyssa P. Hacker 打算 通过 增加 缓冲 器 来 降低 最 短路 径 速度 以 便 修复 Ben 的 电路 ， 如 图 3-44 所 
示 。 缓 冲 器 和 其 他 门 有 相同 的 延迟 。 确 定 电路 的 最 大 时 钟 频率 ， 并 确定 是 否 会 出 现 保持 时 间 问 题 。 

解 : 图 3-45 显示 了 说 明 信 和 号 变化 的 波形 图 。 从 4 到 了 的 关键 路 径 不 受 影响 ， 因 为 它 没有 
经 过 任何 缓冲 器 。 所 以 ， 最 大 时 钟 频率 仍然 是 4GHz。 但 是 ， 最 短路 径 被 缓冲 器 的 最 小 延迟 变 
慢 了 。X' 在 i + 2t,, =30+2x25 =80ps 之 前 都 保持 不 变 。 这 是 在 保持 时 间 60ps 后 ， 所 以 电路 
运行 正常 。 

这 个 例子 使 用 了 一 个 不 常见 的 长 保持 时 间 来 说 明 保 持 时 间 问 题 。 大 多 数 的 触发 器 设计 成 i 
<i. 来 避免 这 类 问题 。 但 是 ， 有 些 高 性 能 的 微 处 理 器 (包括 奔腾 4) 在 触发 器 中 使 用 了 称 为 脉冲 
锁 存 器 ( pulsed latch) 的 元 件 。 脉 冲 触发 器 的 行为 类 似 于 触发 器 ,但 是 它 的 时 钟 到 Q 的 延迟 很 
短 ， 且 保持 时 间 很 长 。 总 之 ， 增 加 缓冲 器 通常 (但 并 不 总 是 ) 能 在 不 降低 关键 路 径 速 度 的 同时 
解决 保持 时 间 问 题 。 4 
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3-44 解决 保持 时 间 问 题 的 修正 电路 图 3-45 ”增加 缓冲 器 来 解决 保持 时 间 问 题 的 时 序 图 
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3.5.3 ”时钟 偏 移 ” 
在 前 面 的 分 析 中 ， 我 们 假设 时 钟 总 是 在 同一 时 刻 到 达 各 个 寄存 器 。 在 现实 中 ， 每 个 寄存 器 
延迟 


的 时 钟 到 达 时 间 总 是 有 所 不 同 的 。 这 个 时 钟 沿 到 达 
时 间 的 变化 称 为 时 钟 偏 移 (clock skew)。 例 如 ， 从 
时 钟 源 到 不 同 寄 存 器 之 间 的 线路 长 度 不 同 ， 导 致 延 
迟 的 微小 差异 ， 如 图 3-46 所 示 。 噪 声 也 可 以 导致 不 
同 的 延迟 。3. 2.5 节 介 绍 的 时 钟 门 控 也 可 以 进一步 
延迟 时 钟 。 如 果 一 些 时 钟 经 过 门 控 ， 而 另 一 些 没 
有 ， 则 门 控 时 钟 和 非 门 控 时 钟 之 间 就 一 定 存在 偏 
移 。 图 3-46 中 的 CLK2 HE CLKI 早 ， 因 为 在 两 个 寄 
存 右 之 间 的 时 钟 线路 上 有 一 条 通路 。 如 果 时 钟 的 路 
径 不 同 ，CLK1 也 可 能 会 早 一 些 。 在 进行 时 序 分 析 
时 ， 需 要 考虑 最 坏 情 况 ， 这 样 可 以 保证 电路 在 所 有 
环境 下 都 可 以 工作 。 
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图 3-46 ”由 线路 延迟 引起 的 时 钟 偏 移 


图 3-47 是 在 图 3-38 上 增加 了 时 钟 偏 移 后 的 时 序 分 析 。 粗 时 钟 线 表 示 时 钟 信号 到 达 每 个 寄 
存 器 的 最 迟 时 间 ， 虚 线 表示 时 钟 可 能 提前 i, 时 间 到 达 。 
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i sh 
RI R2 
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图 3-47 和 带 时 钟 偏 移 的 时 序 图 
首先 ， 考 虑 图 3-48 中 的 建立 时 间 约 束 。 在 最 坏 情 况 下 ，RI1 收 到 最 迟 偏 移 时 钟 ，R2 收 到 最 


早 侦 移 时 钟 ， 尽 可 能 留 下 一 点 时 间 在 两 个 寄存 器 之 间 
进行 数据 传播 。 
数据 通过 寄存 占 和 组 合 逻辑 传播 ， 并 必须 在 R2 R 
样 前 建立 。 所 以 可 以 得 到 : 
1 (3- 19 ) 
tate ty (6, + to, + ty) (3-20) 
下 一 步 ， 考 虑 图 3-49 中 的 保持 时 间 约 束 。 在 最 坏 
情况 下 ，Rl 接收 最 早 偏 移 时 钟 CLK1，R2 接收 最 迟 偏 
移 时 钟 CLK2。 数 据 通 过 寄存 器 和 组 合 逻 辑 传输 ， 且 必 
须 在 经 过 慢 时 钟 的 保持 时 间 后 到 达 ， 所 以 可 以 得 到 : 
cm + bog = bd Diow (3-21) 
ta tho Tn ee (3-22) 


总 之 ， 时 钟 偏 移 显著 增加 了 建立 时 间 和 保持 时 间 。 


CLK1 
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图 3-48 ” 带 时 钟 偏 移 的 建立 时 间 约 束 
它 将 增加 时 序 总 开销 ， 减 少 组 合 逻 辑 的 


有 效 工 作 时 间 。 它 也 增加 了 通过 组 合 逻 辑 所 需要 的 最 小 延迟 。 即 使 faa =0， 如 果 trey > ts， 一 
对 背靠背 的 触发 器 将 不 满足 式 (3-22) 。 为 了 防止 严重 的 保持 时 间 错 误 ， 设 计 者 绝对 不 能 允许 太 
多 的 时 钟 偏 移 。 当 时 钟 偏 移 存 在 时 ， 有 时 故意 将 触发 器 设计 为 特别 慢 ( 增 大 :.,, ) 来 防止 保持 时 


间 问 题 。 
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图 3-49 ” 带 时 钟 偏 移 的 保持 时 间 约 束 


时 钟 偏 移 的 时 序 分 析 

重新 考虑 例 3. 10， 假 定 系统 的 时 钟 偏 移 为 50ps。 

解 : 关键 路 径 保持 一 样 ， 但 因 时 钟 偏 移 关系 ， 建 立时 间 显 著 增 加 。 所 以 ， 最 小 周期 时 间 是 

T, S bog 3ta +t + bey = 80 +3 x 40 +50 +50 =300ps (3-23) 

最 大 时 钟 频率 是 人 = 1/7, = 3. 33GHz, | 

最 短路 径 也 保持 不 变 ， 即 55ps。 因 为 时 钟 偏 移 ， 所 以 保持 时 间 显 著 增 加 为 60 +50 = 110ps, 
它 比 55ps 大 很 多 。 所 以 ， 电 路 将 违反 保持 时 间 约 束 ， 在 任何 频率 都 将 发 生 故 障 。 即 使 没有 时 
钟 偏 移 时 ， 电 路 也 违反 保持 时 间 约 束 。 系 统 的 时 钟 偏 移 会 造成 更 严重 的 违反 时 间 保 持 约 东 
问题 。 < 

Y E K LE EEFT EAR 

重新 考虑 例 3. 11 ， 假 设 系统 的 时 钟 偏 移 是 50ps。 

解 : 关键 路 径 不 受 影 响 , 所 以 最 大 时 钟 频率 仍然 


rll 
为 3.33GHz。 ara D Q 
最 短路 径 增 加 到 80pso XAR HE thoy + tere HI 110ps 小 ， 所 


以 电路 仍然 违反 保持 时 间 约 束 。 


为 了 修复 这 个 问题 ,需要 插入 更 多 的 缓冲 器 。 在 关键 路 径 baie 
上 也 需要 增加 缓冲 器 来 降低 时 钟 频率 。 另 外 ， 也 可 以 选用 其 他 。 eK i 

保持 时 间 更 短 的 触发 器 。 < va 

EIE 
3.5.4 THAS Ts rE a. 
如 前 所 示 ， 在 孔径 时 间 内 ， 尤 其 是 当 输入 来 自 外 界 时 , KO 如 一 一 J 一 

可 能 总 是 保证 时 序 电路 的 输入 是 稳定 的 。 考 虑 一 个 连接 到 触发 TE 
器 输入 的 按钮 ， 如 图 3-50 所 示 。 按 钮 没有 被 按 下 时 , D=0; 2—+—/ & 
当 按钮 按 下 时 ，D = 1。 在 相对 于 时 钟 上 升 沿 的 某 个 随机 时 间 ， a 
一 只 猴子 按 下 按钮 。 我 们 希望 知道 时 钟 上 升 沿 后 的 输出 0。 情 p | /一 一 一 E 
况 1 ， 当 按钮 在 CIK 之 前 按 下 时 ，Q = 1。 情 况 卫 ， 当 按钮 在 = pi" g 


CLK 之 后 很 久 都 没有 按 下 时 ，Q =0。 人 情况 焉 ， 当 按钮 在 CLK 
之 前 的 上 we 和 CLK 之 后 的 如 之 间 的 某 个 时 间 按 下 时 ,输入 破 图 3-50 输入 在 孔径 时 间 之 前 、 
坏 了 动态 约束 ， 输 出 将 无 法 确定 。 之 后 和 之 间 改 变 


it 7p id FB 7K TF 89 


1. WA 

当 触 发 器 对 孔径 时 间 内 发 生变 化 的 输入 进行 采样 时 ， 输 出 
Q 可 能 随时 取 禁 止 区 域内 0 ~ Vi 之 间 的 一 个 电压 。 这 称 为 亚 稳 态 。 最 终 ， 触 发 右 将 确定 输出 到 
OMA 1 的 稳 态 。 但 是 ， 到 达 稳 态 的 分 辨 时 间 ( resolution time) 是 无 界 的 。 

触发 器 的 亚 稳 态 类 似 于 一 个 放 在 两 个 山谷 之 间 的 山峰 顶点 的 亚 稳 态 
球 ， 如 图 3-51 所 示 。 处 于 山谷 中 的 球 为 稳 态 ， 因 为 它们 在 不 受 干 es 2s 
扰 的 情况 下 可 以 一 直 保 持 它 的 状态 。 在 山峰 顶 上 的 球 为 亚 稳 态 ， 
因为 如 果 保 持 绝对 的 平衡 ， 这 个 球 将 保持 在 山顶 。 但 是 因为 没有 。 图 3.51 稳定 态 和 亚 稳 态 
绝对 的 平衡 ， 所 以 球 将 最 终 滚 落 到 一 边 或 者 另 一 边 。 发 生 这 种 改 
变 所 需要 的 时 间 取 决 于 球 在 最 初 位 置 上 的 平衡 程度 。 每 一 个 双 稳 态 设备 在 两 个 稳 态 之 间 都 存在 
一 个 亚 稳 态 。 

2. 分 辨 时 间 

如 果 触 发 器 在 时 钟 周 期 内 的 随机 时 间 发 生 改 变 ， 那么 为 达到 稳 态 所 需要 的 分 辨 时 间 tess 
也 是 一 个 随机 变量 。 如 果 输 入 在 孔径 时 间 外 改变 ， 则 4 = to 但 是 ， 如 果 输 入 在 孔径 时 间 内 
改变 ， 则 zt 一 定 比 较 长 。 理 论 和 实验 分 析 ( 见 3.5.6 节 ) 指 出 ,分 辨 时 间 i. 大 于 任意 时 间 ; 的 
概率 按 i 的 指数 减少 : 

Pet >i) = oet (3-24) 

TRAR, TA r 由 触发 器 的 属性 决定 。 式 (3-24) 仅 在 t 比 二 ,大 的 条 件 下 有 效 。 


直观 地 ， 也 表示 在 最 坏 时 间 ( 比如 ， 和 孔径 时 间 ) 内 输入 发 生 改变 的 概率 。 这 个 概率 随 周期 


时 间 工 减少 。7 是 一 个 时 间 常 量 ， 它 说 明 触 发 器 从 亚 稳 态 移 开 的 速度 ， 这 与 触发 器 中 交叉 耦合 
门 的 延迟 有 关 。 

总 之 ， 如 果 触 发 器 等 双 稳 态 设备 的 输入 在 孔径 时 间 内 发 生 改 变 ， 则 输出 在 稳定 到 0 或 者 1 
之 前 是 一 个 亚 稳 态 值 。 达 到 稳 态 的 时 间 是 无 界 的 ， 因 为 对 于 任何 有 限时 间 :， 触 发 器 仍 处 于 亚 
稳 态 的 概率 都 不 是 0。 但是， 这 个 概率 将 随 着 上 的 指数 而 减少 。 所 以 ， 如 果 等 待 时 间 足 够 长 ， 
超过 了 ts， 那么 触发 避 达 到 一 个 有 效 逻 辑 电 平 的 概率 将 很 高 。 


3.5.5 同步 器 

对 于 数字 系统 ， 来 自 真实 世界 的 异步 输入 是 不 可 能 避免 的 。 比 如 ， 人 的 输入 就 是 异步 的 。 
如 果 处 理 不 当 ， 系 统 中 的 这 些 异 步 输入 将 导致 亚 稳 态 电压 ， 从 而 产生 很 难 发 现 和 改正 的 不 稳定 
的 系统 错误 。 数 字 系 统 设 计 人 员 的 目标 是 : 对 于 给 定 的 异步 输入 ， 确 保 遇 到 的 亚 稳 态 电压 的 概 
率 足 够 小 “足够 ”取决 于 应 用 环境 。 对 于 数字 移动 电话 ,在 10 年 内 有 一 次 失效 是 可 以 接受 
的 。 因 为 即使 它 锁 死 了 ， 用 户 也 可 以 关机 ， 然 后 再 打 过 去 。 对 于 医 CLK 
疗 设备 ， 在 预期 的 宇宙 生命 (10 年 ) 中 产生 一 次 失效 将 是 一 个 更 好 的 
指标 。 为 了 确保 产生 正确 的 逻辑 电 平 ， 所 有 的 异步 输入 必须 经 过 同步 a Q 
2 (synchronizer ) 。 i 

图 3-52 给 出 了 一 个 同步 器 。 它 接收 异步 输入 信号 D 和 时 钟 图 3-52 同步 器 的 符号 
CLK。 在 有 限时 间 内 ， 它 产生 一 个 输出 0， 输 出 为 有 效 逻 辑 电压 的 
概率 很 高 。 如 果 在 孔径 时 间 内 D 是 稳定 的 ， 则 0 将 取 与 D 一样 的 值 。 如 果 在 孔径 时 间 内 D 发 
生变 化 ， 则 Q 可 能 取 HIGH 或 者 LOW ， 但 是 它 一 定 不 会 是 亚 稳 态 。 

图 3-53 显示 了 用 2 个 触发 器 来 建立 同步 器 的 简单 方法 。F1 在 CLK 的 上 升 沿 对 D 进行 采 
样 。 如 果 D 在 这 个 时 刻 发 生 改 变 ， 则 输出 D2 将 出 现 暂 时 的 亚 稳 态 。 如 果 时 钟 周期 足够 长 ， 则 


[152] 


90 第 3 章 


在 周期 结束 前 D2 成 为 一 个 有 效 逻 辑 电 平 的 概率 很 高 。 然 后 F2 对 D2 进行 采样 ， 它 现在 是 稳定 
的 ， 将 产生 一 个 好 的 输出 Qo 


如 果 同 步 器 的 输出 8 为 亚 稳 态 ， 那 么 这 个 同 CLK CLK 
步 器 将 失效 。 如 果 在 F2 上 必须 建立 的 时 间 前 ( 即 ， pe fg 
如 果 i > T,- tren) D2 没有 变 成 有 效 的 电 平 ， 则 Fl Fo 


可 能 出 现 这 种 情况 。 根 据 式 (3-24)， 在 随机 时 间 
内 输出 信号 的 改变 导致 同步 器 失效 的 概率 是 : 


P( KR) = e — (3-25) 

失效 的 概率 P(failure ) 是 信号 D 改变 时 ， 输 

出 0 为 亚 稳 态 的 概率 。 如 果 D 每 秒 改 变 一 次 ， 则 
每 秒 失效 的 概率 就 是 P( 失效 )。 如 果 D 每 秒 改 变 
N 次 ， 则 失效 的 概率 就 需要 乘 以 N: ' tus tmp “Eon 


P( K%&)/sec = Note (3-26) 图 3-53 一 个 简单 的 同步 器 


; 











系统 的 可 靠 性 通常 由 平均 失效 间隔 时 间 ( Mean Time Between Failure, MTBF) 度量 。 根 据 定 


义 可 以 看 出 ，MTBF 是 系统 失效 之 间 的 平均 时 间 。 它 是 系统 失效 概率 的 倒数 : 


Te-tsetup 


1 Te 7 

P( 失效)7sec ” NT, 

式 (3-27) 指 出 ，MTBF 随 着 同步 器 延迟 也 .的 指数 增加 。 对 于 多 数 系统 ， 等 待 一 个 时 钟 周 期 
Biri ll 一 个 安全 的 MTBF, 在 弄 沉 部 速 系统 中 可 能 需要 等待 更 多 的 周期 。 

有 限 状 态 机 输入 的 同步 器 

3.4.1 1h ASAT RE BB A ARS OLA ME A 假定 同步 器 用 于 保 
证 控制 器 得 到 稳定 的 输入 信号 。 交 通 到 达 的 次 数 是 平均 0. 2 次 每 秒 。 同 步 器 中 的 触发 器 具有 
如 下 特性 : 7 =200ps, T, =150ps, tau =500ps。 这 个 同步 器 的 时 钟 周 期 是 多 少 才能 使 MTBF 
超过 1 年 ? 

解 : 1 年 =m x10'(s)。 求 解 式 (3-27)。 


MTBF = (3- 275 


1x10’ = T e mr /(0.2)(150 x10?) ` (3-28) 
该 式 没有 封闭 解 。 但 是 ,通过 猜想 和 检验 很 容易 求解 。 在 数据 表 中 ， 尝 试 将 一 些 7. 值 带 入 
来 计算 MTBF, HF 7 的 值 可 以 保证 MTBF 为 1 年 : 7. =3. 036ps。 4 


3.5.6 分 辨 时 间 的 推导 ” 


式 (3-24) 可 以 使 用 电路 理论 、 微 分 方程 和 概率 论 等 基础 知识 推导 出 来 。 如 果 读 者 对 推导 不 
感 兴趣 或 对 相关 数学 知识 不 了 解 ， 可 以 跳 过 此 节 。 
在 给 定时 间 1 后 触发 器 处 于 亚 稳 态 ， 如 果 触 发 器 对 正在 变化 的 输入 (将 产生 亚 稳 态 条 件 ) 进 行 
采样 ， 而 且 输 出 在 时 钟 沿 后 的 这 段 时 间 内 没有 达到 稳定 的 电 平 。 这 个 过 程 可 以 用 数学 公式 描述 : 
P(t, >t) = P( 对 正在 改变 的 输入 进行 采样 ) x P( 没 有 达到 稳定 的 电 平 ) (3-29) 
我 们 认为 每 个 概率 项 都 是 独立 的 。 在 某 个 时 刻 ， 异 步 输入 信号 tw 在 0 和 1 之 间 切 换 ， 如 
图 3-54 所 示 。 在 时 钟 沿 附近 的 孔径 时 间 内 输入 发 生 改 变 的 概率 是 
已 (对 正在 改变 的 输入 进行 采样 ) = (ti + bw + ta)/T (3-30) 
如 果 触 发 器 以 概率 P( 对 正在 改变 的 输入 进行 采样 ) 的 进入 亚 稳 态 ， 则 从 亚 稳 态 到 成 为 有 效 
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电 平 的 时 间 取 决 于 电路 的 内 部 工作 原理 。 分 辨 时 间 确 定 P( 没 有 达到 稳定 的 电 平 )， 即 在 时 间 t 





后 触发 器 没有 成 为 有 效 电 平 的 概率 。 本 节 后 续 部 分 通过 分 析 r. | 
一 个 简单 的 双 稳 态 器 件 模型 来 估计 这 个 概率 。 fae ET a aaa | 

双 稳 态 器 件 以 正 反馈 方式 存储 。 图 3-55a 给 出 了 用 一 对 反 | ey heat ! 
相 器 实现 的 正 反馈 。 这 个 电路 的 行为 代表 了 大 多 数 典型 的 双 。 | 
稳 态 元 件 。 一 对 反 相 器 的 行为 类 似 于 缓冲 器 。 我 们 用 对 称 直 edt 
流传 输 特性 为 它 建 模 ， 如 图 3-55b 所 示 ， 其 斜率 为 G6。 缓冲 器 oh oy ; 
只 能 提供 有 限 的 输出 电流 。 可 以 将 其 建 模 为 一 个 输出 电阻 R。 图 3-54 输入 时 序 


所 有 真实 的 电路 都 有 必须 充电 的 电容 C。 通 过 电阻 对 电容 充电 形成 RC 延迟 ， 阻 止 缓冲 器 在 瞬间 
进行 切换 。 所 以 ， 完 整 的 电路 模型 如 图 3-55c MR, Hoa C) 为 双 稳 态 器 件 的 传输 状态 的 电压 。 


Vout 


xT slope = G Vin (N Vout (2) i@ 
g 
C 


0 "is 
v(t) Vow /2 V op ae 


a) b) c) 
图 3-55 双 稳 态 器 件 的 电路 模型 


该 电路 的 亚 稳 态 点 是 v(t) =v,(t) = Vp/2。 如 果 电 路 刚好 在 这 一 点 开始 工作 ， 则 它 将 在 
没有 噪声 的 情况 下 永远 保持 在 这 里 。 因 为 电压 是 连续 变量 ， 所 以 电路 刚好 在 亚 稳 态 这 一 点 开始 
工作 的 机 会 非常 小 。 但 是 ， 电 路 可 能 处 于 亚 稳 态 附近 的 时 刻 0 开始 ， 即 ww (0) = Vbo/2 + AV, 
其 中 AV 是 小 偏 移 量 。 在 这 种 情况 下 ， 如 果 AV>O, WIE RRA RH va (t) E) Vo; WE 
AV<0， 将 驱动 v(t) 到 0。 到 达 Voa O 所 需要 的 时 间 正 是 双 稳 态 器 件 的 分 辨 时 间 。 

直流 传输 特性 是 非 线性 的 ， 但 它 在 我 们 感 兴趣 的 亚 稳 态 点 附近 表现 为 线性 的 。 特 别 是 ， 如 
Ke v;,(t) =TJoo2 + AV/G, W4 AV 很 小 时 ，z a(t) =V,)/2 +AY。 通 过 电阻 的 电流 是 zi) = 
(4zuu(i) -v(t))XR。 电 容 充 电 的 速率 是 dv,, (1)/dt =i(1)/C。 将 这 些 综 合 到 一 起 ， 可 以 得 出 
输出 电压 的 产生 方程 式 。 

(G-1) 





dv „(t)/dt = RC [vatt - Voo] (3-31) 
这 是 一 个 一 阶 线性 微分 方程 。 根 据 初 始 条 件 vw,(:) = Vyp/2 + AV 求解 该 方程 式 。 
v (NV e (3- 32) 


图 3-56 描绘 了 对 于 给 定 的 不 同 起 始点 电压 v。, (i) 的 轨迹 。v。,(i) 旦 指数 远离 亚 稳 态 点 Voo/2， 
直到 它 饱和 为 Vo 或 者 0。 输 出 电压 最 终 将 为 1 或 者 0。 所 花费 的 时 间 取 决 于 从 亚 稳 态 点 Vp /2 
到 初始 电压 的 偏 移 量 ( AV) 。 


Vaa (D 


3-56 ap BEL aE 
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为 了 求 分 辨 时 间 t.。， 来 解 式 (3-32) ,使 得 v(t ) = Yo 或 者 0， 给 出 








(6-1) tres V 

IAVle © = (3-33) 
， 

ee ee Ae (3-34) 


总 之 ， 如 果 双 稳 态 器 件 有 导致 输出 改变 很 慢 的 很 大 的 电阻 和 电容 ， 那 么 分 辨 时 间 会 增加 。 
如 果 双 稳 态 器 件 有 很 大 的 增益 C， 则 分 辨 时 间 会 减 小 。 当 电路 在 紧 挨 着 亚 稳 态 的 点 开始 (Ar 一 
0) 时 ， 分 辨 时 间 也 会 呈 对 数 增加 。 


定义 r 为 二 。 给 定 分 辩 时 间 4.。， 为 了 确定 初始 偏 移 量 AY。 ， 求 解 式 (3-34)， 


AV, = et (3-35) 

{Bc ON is AS as FET TE FEE EY A ET ORE A HL v,(0) 为 电压 mp 和 0 之 间 。 在 时 

间 后 输出 没有 成 为 合法 值 的 概率 取决 于 初始 偏 移 量 足 够 小 的 概率 。 尤 其 是 ,在 v,, 上 的 初始 

偏 移 量 小 于 AV n AAE vp 上 的 初始 偏 移 量 必须 小 于 AT _ZC。 双 稳 态 器 件 对 输入 进行 采样 时 
得 到 足够 小 的 初始 偏 移 量 的 概率 为 : 











ne V Ar _ 2AV res 
P( 没 有 达到 稳定 的 电 平 ) = P{ jv,(0) - -型 | < ot) = Fe (3-36) 
Se EAR, 分辨 时 间 大 于 时 间 ;的 概率 由 下 式 给 出 
P(t. > t) “ie l switch + Í setup + Phot =! (3-37) 


Gr 
观察 式 (3-37) ， 并 按 式 (3-24) 形 式 重 写 ， 1 = (lu + tray +t )/G, T= RC/(G-1), Ñ 
之 ， 我 们 已 经 得 出 式 (3-24) ， 并 证 明 TA 取决 于 双 稳 态 需 件 的 物理 属性 。 


3.6 并 行 

系统 的 速度 可 以 用 延迟 和 通过 系统 的 信息 吞吐 量 来 度量 。 任 务 (token) 定义 为 经 过 处 理 后 
能 产生 一 组 输出 的 一 组 输入 。 可 以 采用 可 视 化 的 方法 理解 ， 即 在 电路 图 中 输入 这 些 任 务 ， 并 通 
过 电路 得 到 结果 。 延 迟 (lateney) 是 从 开始 到 结束 所 需要 的 时 间 。 吞 吐 量 (throughout) 是 系统 单 
位 时 间 内 产生 任务 的 数量 。 

GEED 饼干 的 延迟 和 吞 叶 量 

Ben 决定 举行 一 个 牛奶 和 饼干 晚宴 来 庆祝 交通 灯 控 制 器 成 功 安 装 。 做 好 饼干 并 放 和 人 盘 中 需 
BETES 分钟 。 将 饼干 放 入 烤箱 烤 好 需要 花 15 分 钟 。 当 饼干 烤 好 后 ， 他 开始 做 下 一 盘 饼干 。Ben 
做 好 一 盘 饼干 的 吞吐 量 和 延迟 是 多 少 ? 

解 : 在 这 个 例子 中 ， 一 盘 饼 干 是 一 个 任务 。 每 盘 的 延迟 是 1/3 小 时 ， 吞吐 量 是 3 盘 / 小 时 。 

你 可 能 会 想 ， 在 同一 时 间 内 处 理 多 个 任务 可 以 提高 吞吐 量 。 这 称 为 并 行 ( parallelism) ， 它 
有 两 种 形式 : 空间 和 时 间 。 空 间 并 行 (spatial parallelism) 提供 多 个 相同 的 硬件 ， 这 样 多 个 任务 
就 可 以 在 同一 时 间 一 起 处 理 。 时 间 并 行 (temporal parallelism) 将 一 个 任务 分 成 多 个 阶段 ， 类 似 于 
装配 线 。 多 个 任务 可 以 分 布 到 所 有 的 阶段 。 虽 然 每 一 个 任务 必须 通过 所 有 的 阶段 ， 但 在 任意 给 
定 的 时 间 内 每 段 都 有 一 个 不 同 的 任务 ， 从 而 使 多 个 任务 可 以 重合 起 来 。 时 间 并 行 通常 称 为 流水 
线 (pipelining) 。 空 间 并 行 有 时 也 只 称 为 并 行 ， 但 是 我 们 避免 这 种 容易 产生 误解 的 命名 约定 。 < 

GEED HTJ 

Ben @ EAA RBI SE, RA EFE. A 8 tT 
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和 时 间 并 行 。 

空间 并 行 : Ben 请 Alyssa 提供 帮助 。Alyssa 有 她 自己 的 饼干 盘 和 烤箱 。 

时 间 并 行 : Ben 拿 来 第 二 个 饼干 盘 。 当 他 把 一 盘 饼 干 放 人 烤箱 时 ， 就 开始 卷 饼干 并 放 和 人 另 
一 个 盘子 里 ， 而 不 是 等 待 第 一 盘 烤 好 。 

使 用 空间 并 行 和 时 间 并 行 后 的 吞吐 量 和 延迟 是 多 少 ? 同时 使 用 两 种 方法 后 吞吐 量 和 延迟 是 多 少 ? 

解 : 延迟 是 完成 一 个 任务 从 开始 到 结束 所 需要 的 时 间 。 在 所 有 情况 下 ， 延 迟 都 是 1/3 小 
时 。 如 果 开 始 时 Ben 没有 饼干 ， 则 延迟 是 他 完成 第 一 盘 饼干 所 需要 的 时 间 。 

吞吐 量 是 每 小 时 烤 好 的 饼干 盘 数 。 使 用 空间 并 行 方法 ，Ben Ail Alyssa 每 20 分 钟 完 成 一 盘 饼 
干 。 所 以 ,吞吐 量 是 以 前 的 2 倍 ， 即 6 盘 / 小 时 。 使 用 时 间 并 行 方法 ，Ben 每 15 分 钟 就 把 一 个 
新 盘 放 人 人 烤箱， 吞吐 量 是 4 盘 / 小 时 。 如 图 3-57 所 示 。 

如 果 Ben 和 Alyssa 同时 使 用 这 两 种 并 行 技术 ， 吞 吐 量 是 8 盘 / 小 时 。 


延迟 : 
完成 第 一 盘 饼 干 所 需要 的 时 间 


空间 并 行 
盘子 1 
盘子 2 
盘子 3 
盘子 4 


时 间 并 行 
盘子 1 
盘子 2 
盘子 3 





图 3-57 烤 饼 干 中 的 时 间 并 行 和 空间 并 行 4 


考虑 一 个 延迟 为 了 的 任务 。 没 有 并 行 的 系统 中 ， 香 吐 量 为 1。 在 空间 并 行 系统 中 有 NT 
相同 的 硬件 ， 则 吞吐 量 为 WL。 在 时 间 并 行 系统 中 ， 可 以 将 任务 理想 地 分 成 等 长 的 NV 个 步骤 或 
阶段 。 在 这 种 情况 下 , :吞吐 量 也 是 NL， 且 只 需要 一 套 硬 件 。 但 是 ,饼干 的 例子 说 明 ， 将 任务 
分 解 为 个 等 长 的 阶段 是 不 切实 际 的 。 如 果 最 长 的 延迟 为 L ， 则 流水 线 的 吞吐 量 为 1/L 。 

流水 线 (时 间 并 行 ) 特 别 有 吸 引力 ， 因 为 它 没有 增加 硬件 就 可 以 加 速 电 路 运行 。 男 外 ， 将 
寄存 器 放 在 组 合 逻 辑 块 之 间 以 便 将 逻辑 块 分 成 可 以 以 用 较 快 时 钟 运行 的 较 短 阶段 。 寄 存 髓 用 于 
防止 流水 线 中 某 一 阶段 的 任务 赶 上 和 破坏 下 一 阶段 的 任务 。 

图 3-58 给 出 了 一 个 没有 流水 线 的 电路 例子 。 它 在 寄存 髓 之 间 包 含 4 个 逻辑 块 。 关 键 路 径 
通过 第 2、3、4 块 。 假 设 寄存 器 的 时 钟 到 O 的 传播 延迟 为 0.3ns， 建 立时 间 为 0.2ns。 那 么 周期 
时 间 是 7 =0.3 +3+2+4+0.2=9.S$ns。 电 路 延迟 为 9.$Sns， 理 吐 量 为 1/9. Sns = 105MHz, 

3-59 给 出 了 一 个 相同 功能 的 电路 ， 但 在 第 3 和 第 4 块 之 间 增 加 了 一 个 寄存 器 将 电路 分 成 
两 阶段 流水 线 。 第 一 阶段 的 最 小 时 钟 周期 是 0.3 +3 +2 +0.2 =5.5ns。 第 二 阶段 的 最 小 时 钟 周 
期 是 0.3 +4+0.2 =4.5Sns。 时 钟 必须 足够 慢 ， 使 得 所 有 阶段 都 能 正确 工作 。 所 以 ，7. =5. Sns。 
延迟 为 2 个 时 钟 周 期 ， 或 11ns。 吞 吐 量 是 1/5. Sns = 182MHz。 这 个 例子 说 明 ， 在 真实 的 电路 
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中 ， 两 阶段 流水 线 通 常 可 以 得 到 几乎 双 倍 的 吞吐 量 和 稍微 增加 的 延迟 。 相 比 之 下 ， 理 想 流水 线 
的 吞吐 量 可 以 提高 一 倍 ， 而 延迟 不 变 。 产 生 差 别 的 原因 在 于 电路 不 可 能 分 成 完全 相等 的 两 半 ， 
而 且 寄存 器 引入 了 额外 的 时 序 开 销 。 





t= 3ns 


T,= 9.5ns 


图 3-58 无 流水 线 的 电路 





t= 3ns 
阶段 1: 5.5ns 阶段 2: 4.5ns 
图 3-59 两 阶段 流水 线 电 路 
图 3-60 给 出 来 分 成 3 阶段 流水 线 的 相同 电路 。 注 意 ， 需 要 2 个 以 上 的 寄存 器 来 存储 第 一 流水 


线 阶段 结束 后 块 1 和 块 2 的 结果 。 周 期 时 间 被 第 三 阶段 限制 为 4 Sns。 延 迟 是 3 个 周期 , 或 13. Sns。 
吞吐 量 为 /4. 5ns =222MHz。 此 外 ， 增 加 一 个 流水 阶段 提高 了 吞吐 量 ， 也 增加 了 一 些 延 迟 。 





阶段 1: 3.5ns 阶段 2: 2.5ns 阶段 3: 4.5ns 


图 3-60 三 阶段 流水 线 电路 


虽然 这 些 技术 都 很 强大 ,但 它们 并 不 能 运用 到 所 有 情况 中 。 并 行 的 克星 是 依存 关系 ( de- 
pendency) 。 如 果 当 前 的 任务 依赖 于 前 一 个 任务 的 结果 ， 而 不 是 当前 任务 中 的 前 一 步 结 果 ， 则 
只 有 前 一 个 任务 完成 后 ， 后 一 个 任务 才能 开始 。 例 如 ，Ben 想 在 开始 准备 第 二 盘 之 前 检查 第 一 
盘 饼 干 的 味道 是 否 好 。 这 就 是 一 个 阻止 流水 线 或 并 行 操作 的 依存 关系 。 并 行 是 设计 高 性 能 微 处 
理 器 的 重要 技术 。 第 7 章 将 进一步 讨论 流水 线 ， 并 用 例子 说 明 如 何 处 理 依 存 关 系 。 


3.7 总 结 


本 章 介绍 了 时 序 逻 辑 电路 的 分 析 和 设计 。 与 输出 只 取决 于 当前 输入 的 组 合 逻 辑 电路 相 比 ， 
时 序 逻 辑 电 路 的 输出 取决 于 当前 和 先前 的 输入 。 换 名 话说， 时 序 逻 辑 电路 记忆 先前 的 输入 信 
息 。 这 种 记忆 称 为 逻辑 的 状态 。 

时 序 逻 辑 电 路 很 难 分 析 ， 并 容易 产生 设计 错误 ， 所 以 我 们 只 关心 小 部 分 成 熟 的 模块 。 需 要 
掌握 的 最 重要 元 件 是 触发 器 ， 它 接收 时 钟 和 输入 刀 , 产生 一 个 输出 O。 和 触发 器 在 时 钟 的 上 升 沿 
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将 DD 复制 到 Q， 其 他 时 候 保 持 O 的 原来 状态 。 共 享 一 个 公共 时 钟 的 触发 器 称 为 寄存 器 。 触 发 器 
还 可 以 接收 复位 和 使 能 控制 信号 。 

虽然 有 多 种 形式 的 时 序 逻 辑 ， 但 我 们 只 考虑 最 容易 设计 的 同步 时 序 逻 辑 电路 。 同 步 时 序 逻 
辑 电路 包含 由 时 钟 驱动 寄存 器 隔 开 的 组 合 逻 辑 块 。 电 路 的 状态 存储 在 寄存 器 中 ， 仅 在 时 钟 沿 到 
达 时 进行 更 新 。 

有 限 状态 机 是 设计 时 序 电 路 的 强 有 力 技术 。 为 了 设计 有 限 状 态 机 ， 首 先 识别 状态 机 的 输入 
和 输出 ， 画 出 状态 转换 图 来 说 明 状 态 和 状态 之 间 的 转换 。 为 状态 选择 一 种 编码 ， 然 后 将 状态 转 
换 图 重 写 为 状态 转换 表 和 输出 表 来 指出 给 定 的 当前 状态 和 输入 的 下 一 个 状态 和 输出 。 通 过 这 些 
R, 设计 组 合 逻辑 来 计算 下 一 个 状态 和 输出 ， 并 画 出 电路 图 。 

同步 时 序 逻 辑 电 路 的 时 序 规范 包括 时 钟 到 O 的 传播 延迟 i,., 和 最 小 延迟 ks， 建立 时 间 taup 
和 保持 时 间 iis。 为 了 正确 操作 ， 它 们 的 输入 在 孔径 时 间 内 必须 稳定 。 和 孔径 时 间 在 在 时 钟 的 上 
升 沿 之 前 启动 建立 时 间 ， 在 时 钟 的 上 升 沿 之 后 结束 保持 时 间 。 系 统 的 最 小 延迟 周期 7 等 于 通过 
组 合 逻 辑 块 的 传播 延迟 ;加 上 寄存 器 的 t+t.,。 为 了 正确 操作 ， 通 过 寄存 器 和 组 合 逻 辑 的 最 
小 延迟 必须 大 于 too 与 常见 的 误解 相反 ， 保 持 时 间 不 影响 周期 时 间 。 

整个 系统 的 性 能 可 以 用 延迟 和 吞吐 量 来 度量 。 延 迟 是 一 个 任务 从 开始 到 结束 需要 的 时 间 。 
厨 吐 量 是 系统 单位 时 间 内 处 理 任 务 的 数量 。 并 行 可 以 提高 系统 的 吞吐 量 。 


习题 

3.1 波形 如 图 3-61 所 示 ， 画 出 SR 锁 存 器 的 输出 Qo 
i fe eee nied 
el S id de so (aie: Hee 


图 3-61 习题 3.1 的 SR 锁 存 器 输入 波形 
3.2 波形 如 图 3-62 所 示 ， 画 出 SR 锁 存 器 的 输出 0。 


eh Ns she cid nee aan 
Ps ls pt Pit Wh op dhe oe 


3-62 ”习题 3.2 的 SR 锁 存 器 输入 波形 
3.3 波形 如 图 3-63 所 示 ， 画 出 D 锁 存 器 的 输出 0。 


wee oUt Sy ae) ae ee 
图 3-63 习题 3.3 和 习题 3.5 的 DD 锁 存 器 或 D 触发 器 的 输入 波形 
3.4 波形 如 图 3-64 所 示 ， 画 出 D 锁 存 器 的 输出 Qo 


Eo ga E ap PN 2 F reem i 


3-64 习题 3.4 和 习题 3.6 的 DD 锁 存 器 或 D 触发 器 的 输入 波形 
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3.5 波形 如 图 3-63 所 示 ， 画 出 D 触发 硕 的 输出 Qo 


3.6 波形 如 图 3-64 所 示 ， 画 出 D 触发 器 的 输出 Qo 

3.7 图 3-65 中 的 电路 是 组 合 逻 辑 电 路 还 是 时 序 逻 辑 电 路 ? 说 明 输 入 与 输出 之 间 的 关系 。 如 何 
称呼 这 个 电路 ? 

3.8 图 3-66 中 的 电路 是 组 合 逻 辑 电路 还 是 时 序 逻 辑 电路 ? 5 


说 明 输 入 与 输出 之 间 的 关系 。 如 何 称呼 这 个 电路 ? 
3.9  T fit A at (toggle flip-flop) 有 一 个 输入 、CLK 和 一 个 
输出 0。 在 每 一 个 CLK 的 上 升 沿 ，Q 的 值 就 变 成 它 
的 前 一 个 值 的 反 。 使 用 D 触发 器 和 反 相 器 画 出 T 触 
发 器 的 原理 图 。 
3.10 JK AREZ CK flip-flop) 接 收 一 个 时 钟 、 两 个 输入 J 
和 KK。 在 时 钟 的 上 升 沿 ， 输 出 0 被 更 新 。 如 果 和 
K 同时 为 0， 则 0 保持 原来 的 值 不 变 。 如 果 只 有 
J=1, WQ=1, WRAAK=1, WE=0, mR 
J=K=1, W O 的 值 就 切换 成 它 的 前 一 个 值 的 反 。 
(a) 使 用 DD 触发 器 和 一 些 组 合 逻 辑 构造 下 fih 
发 器 。 
(b) 使 用 JK 触发 器 和 一 些 组 合 逻 辑 构造 D 触 
发 器。 
(c) 使 用 下 触发 器 和 一 些 组 合 逻 辑 构造 T 触 
发 器 。 
3.11 图 3-67 中 的 电路 称 为 Muller C 元 件 。 请 简要 说 明 输 
入 与 输出 之 间 的 关系 。 Am: as 
12 ”使 用 逻辑 门 设计 一 个 带 异 步 复位 功能 的 D 锁 存 器 。 a c 
13 ”使 用 逻辑 门 设计 一 个 带 异 步 复位 功能 的 D 触发 器 。 B- 
使 用 逻辑 门 设计 一 个 带 同步 置 位 功能 的 D 触发 器 。 a 
15 ”使 用 逻辑 门 设计 一 个 带 异 步 置 位 功能 的 D 触发 器 。 
16 ”假设 由 NN 个 反 相 器 连接 成 环 而 构成 的 一 个 环形 振荡 MSG? Moller TGF 
器 。 每 一 个 反 相 器 的 最 小 延迟 为 1,， 最 大 延迟 为 +,。 如 果 N 是 奇数 ， 确 定 这 个 振荡 器 
的 频率 范围 。 
3.17 在 习题 3.16 H, HA N 必须 为 奇数 。 
3.18 图 3-68 中 的 哪些 电路 是 同步 时 序 电 路 ， 为 什么 ? 





一 人 
A 


a) 





图 3-68 电路 


3. 19 为 一 栋 25 层 的 建筑 物 设计 一 个 电梯 控制 器 。 这 个 控制 器 有 两 个 输入 UP 和 DOWN, VW 
及 指明 当前 电梯 所 在 楼 层 的 输出 。 没 有 13 这 个 楼 层 。 控 制 器 的 状态 最 少 需要 几 位 ? 
3.20 设计 一 个 有 限 状 态 机 来 跟踪 电子 设计 实验 室 里 4 个 学 生 的 心情 。 学 生 的 心情 有 HAPPY 
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3. 21 


3. 23 


3. 24 


3. 25 


3. 27 


(开心 , 电路 正常 工作 )、SAD (人 忧愁, 电路 烧 坏 )、BUSY (忙碌 ， 正 在 设计 电路 )、 

CLUELESS( RÆ, BALE AT ADC) ASLEEP (E, DERRER EEE) 。 这 个 有 限 状 

态 机 需要 多 少 个 状态 ? 至 少 需要 多 少 位 来 代表 这 些 状 态 ? 

习题 3. 20 中 的 有 限 状 态 机 可 以 分 解 成 多 少 个 简单 的 状态 机 ? 每 一 个 简单 状态 机 需要 多 

少 个 状态 ? 分 解 后 的 设计 至 少 需要 多 少 位 ? 

说 明 图 3-69 中 状态 机 的 功能 。 使 用 二 进 制 编码 ， 完 成 这 个 有 限 状 态 机 的 状态 转换 表 和 

输出 表 。 写 出 下 一 个 状态 和 输出 的 布尔 表达 式 ， 并 且 画 出 这 个 有 限 状 态 机 的 原理 图 。 
复位 
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图 3-69 ”状态 转换 图 


说 明 图 3-70 中 状态 机 的 功能 。 使 用 二 进 制 编码 ， 完 成 这 个 状态 机 的 状态 转换 表 和 输出 
表 。 写 出 下 一 个 状态 和 输出 的 布尔 表达 式 ， 并 且 画 出 这 个 状态 机 的 原理 图 。 





4+B/0 
图 3-70 ”状态 转换 图 


在 Academic 大 道路 和 Bravado 大 道 的 十 字 路 口上 ， 交 通 事故 还 是 时 有 发 生 。 当 灯 B 变 绿 
fi, ESRB MoE RRA. EXT A 变 成 红色 前 ， 他 们 与 踏 踢 在 十 字 路 口 缺 乏 睡 眠 的 
计算 机 专业 的 学 生 撞 到 一 起 。 扩 展 3.4.1 节 的 交通 灯 控 制 器 ， 在 灯 变 成 绿色 前 ， 让 2 个 
灯 保 持 红色 5 秒 。 画 出 改进 的 Moore 型 状态 机 的 状态 转换 图 、 状 态 编码 、 状 态 转换 表 、 
输出 表 、 下 一 个 状态 和 输出 的 等 式 ， 并 且 画 出 这 个 有 限 状 态 机 的 原理 图 。 

3.4.3 节 中 Alyssa 的 蜗牛 有 一 个 女儿 ， 它 有 一 个 Mealy 型 状态 机 的 有 限 状态 机 大 脑 。 当 
a oe JL Mat 1101 或 1110 时 就 会 微笑 。 为 这 只 快乐 的 蜗牛 用 尽 可 能 少 的 状态 画 出 状态 
转换 图 。 选 择 状 态 的 编码 ， 使 用 你 的 编码 写 出 组 合 的 状态 转换 表 和 输出 表 。 写 出 下 一 个 
状态 和 输出 的 等 式 ， 画 出 有 限 状 态 机 的 原理 图 。 

你 将 参与 为 部 门 休息 室 设计 一 个 苏打 汽水 自动 售 货 机 。 苏 打 水 项 目 由 IEEE 的 学 生 分 会 
部 分 资助 的 ， 因 此 它们 的 价格 仅 为 25 美 分 。 机 器 接收 5 美 分 、10 美 分 和 25 美 分 硬币 。 
当 投入 足够 的 硬币 时 ， 苏 打 汽 水 自动 售 货 机 就 会 分 配 汽 水 和 找 零钱 。 为 这 个 苏打 汽水 自 
动 售 货 机 设计 一 个 有 限 状 态 机 控制 器 。 有 限 状态 机 的 输入 是 Nickel(5 美 分 ) 、Dime(10 
美 分 ) 和 Quarter(25 美 分 ) ， 表 示 硬 币 已 经 投入 机 器 。 假 设 在 一 个 周期 投 一 个 硬币。 输 
出 是 Dispense、ReturnDime 、ReturnTwoDime。 当 有 限 状 态 机 达到 25 美 分 时 ， 它 将 给 出 
Dispense 和 相应 的 Return 输出 ， 需 要 给 出 合适 的 找 零 。 接 着 它 准备 开始 接收 硬币 以 便 售 
卖 下 一 瓶 苏打 汽水 。 

格雷 码 ( Gray code) 有 一 个 很 有 用 的 特点 ， 因 为 在 连续 的 数字 中 只 有 一 个 信号 位 的 位 置 
不 同 。 表 3-23 列 出 了 3 位 格雷 码 表 示 的 0 ~7 的 数字 。 设 计 一 个 没有 输入 ， 有 3 个 输出 
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3. 28 


3. 29 


第 3 章 





的 3 位 模 8 格雷 码 计数 器 有 限 状 态 机 ( 模 N 计数 器 指 从 0 ~N -1 计数， 并 不 断 重 复 。 例 ， 
如 ， 手 表 的 分 钟 和 秒 是 模 60 的 计数 器 ， 从 0 ~ 59 计数 ) 。 当 重启 时 ， 输 出 为 000。 在 每 
一 个 时 钟 沿 ， 输 出 进入 下 一 个 格雷 码 。 当 达到 100 时 ， 它 将 从 000 开始 重复 。 


表 3-23 3 位 格雷 码 





扩展 习题 3. 27 中 的 模 8 格雷 码 计数 器， 增加 一 个 UP 输入 变 成 UP/DOWN i+ eH. 
UP =1 时 ， 计 数 需 进入 下 一 个 格雷 码 。 当 UP =0 时 ,计数 器 退回 到 上 一 个 格雷 码 。 
设计 一 个 有 限 状态 机 ， 它 有 2 PA A ALB, POA 1 个 输出 Z。 在 周期 n 内 输出 2Z ,是 输 
A 4, 和 前 一 个 输入 A, ,的 AND 或 者 OR， 其 运算 取决 于 男 一 个 输入 B: 

Zl SAA a B, =0 

Forel, tak ly oR et 
(a) 根据 图 3-71 给 出 的 输入 画 出 Z 的 波形 图 。 
(b) 它 是 Moore 型 状态 机 还 是 Mealy 型 状态 机 ? 
(c) 设计 这 个 有 限 状 态 机 。 画 出 状态 转换 图 和 编码 的 状态 转换 表 、 下 一 个 状态 和 输出 等 

式 、 原 理 图 。 





图 3-71 有 限 状态 机 输入 的 波形 


设计 一 个 有 限 状 态 机 ， 它 有 1 个 输入 4，2 个 输出 三 和 了 了 。 如 果 4 有 3 个 周期 为 1， 则 工 
为 1( 没 有 必要 连续 ) 。 如 果 4 在 至 少 2 个 连续 的 周期 内 为 1， 则 了 为 1。 画 出 状态 转换 
图 和 编码 的 状态 转换 表 、 下 一 个 状态 和 输出 等 式 、 原 理 图 。 


X 
CLK CLK 


3-72 有 限 状 态 机 的 原理 图 
分 析 图 3-72 中 的 有 限 状 态 机 。 写 出 状态 转换 表 和 输出 表 ， 画 出 状态 转换 图 。 简 单 介 绍 
有 限 状态 机 的 功能 。 
重复 习题 3 31， 有 限 状态 机 如 图 3-73 所 示 。 注 意 寄 存 器 的 > 和 * 输入 分 别 表明 复位 和 置 位 。 





图 3-73 有 限 状 态 机 的 原理 图 
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3.33 Ben 设计 了 一 个 图 3-74 的 电路 来 计算 4 输入 异 或 (XOR ) 函数 的 寄存 器 。 每 一 个 2 输入 


3. 34 


异 或 门 的 传输 延迟 为 100ps， 最 小 延迟 为 55ps。 每 一 CLK 
个 触发 器 的 建立 时 间 为 60ps， 保 持 时 间 为 20ps， 时 钟 
Aj O 的 最 大 延迟 是 70ps， 时 钟 到 oO 的 最 小 延迟 


是 50ps。 . 
(a) 如 果 不 存在 时 钟 偏 移 ， 则 电路 的 最 大 运行 频率 是 CLK 
BIG? 
(b) 如 果 电 路 必须 工作 在 2GHz， 则 电路 能 够 承受 的 Day 
时 钟 俩 移 是 多 少 ? 
图 3-74 4 输入 异 或 电路 的 寄存 器 
(c) 在 电路 满足 保持 时 间 约 束 的 条 件 下 ， 电 路 能 够 承 
受 的 时 钟 偏 移 是 多 少 ? 


(d) Alyssa 说 她 能 够 重新 设计 在 寄存 器 之 间 的 组 合 逻 辑 ， 使 其 更 快 且 能 够 承受 更 大 的 时 
钟 偏 移 。 她 的 改进 电路 也 使 用 2 输入 异 或 门 ,但 它们 的 排列 不 同 。 她 的 电路 是 什 
么 ”如 果 不 存 在 时 钟 偏 移 ， 它 的 最 大 频率 是 多 少 ? 在 满足 保持 时 间 约 束 条 件 下 ， 
电路 能 够 承受 的 时 钟 偏 移 是 多 少 ? 

为 2 位 RePentium 处 理 需 设计 一 个 加 法 器 。 这 个 加 法 顺 

由 2 个 全 加 上 需 构 成 ， 这 样 第 一 个 加 法 器 的 进位 输出 连 

接 到 第 二 个 加 法 器 的 进位 输入 ， 如 图 3-75 所 示 。 加 法 

器 有 输入 和 输出 寄存 器 ， 必 须 在 一 个 时 钟 周期 内 完成 

加 法 运算 。 和 在 每 一 个 全 加 器 中 ， 从 Ci 到 CGC, 或 到 

Sum( 5) 的 传播 延迟 为 20ps， 从 4 IÈ B 到 Co 的 传播 延 

WA 25ps, MA EX B 到 5 传播 延迟 为 30ps。 在 加 法 器 

R, A CC, 到 其 他 输出 的 最 小 延迟 为 13ps， 从 4 或 妃 到 

其 他 输出 的 最 小 延迟 为 22ps。 每 一 个 触发 器 的 建立 时 

间 是 30ps， 保 持 时 间 是 10ps， 时 钟 到 QO 的 传播 延迟 是 

35ps， 时 钟 到 Q 的 最 小 延迟 是 21ps。 

(a) 如 果 不 存 在 时 钟 偏 移 ， 则 电路 的 最 大 运行 频率 是 多 少 ? 

(b) 如 果 电 路 必须 工作 在 8GHz， 电 路 能 够 承受 的 时 钟 偏 移 是 多 少 ? 

(c) 在 满足 保持 时 间 约 束 的 条 件 前 ， 电 路 能 够 承 的 时 钟 偏 移 是 多 少 ? 

现场 可 编程 门 阵列 (FPCA) 使 用 可 配置 的 远 辑 块 (CLB ) 而 不 是 逻辑 门 来 实现 组 合 逻 辑 。 

对 于 每 一 个 CLB Xilinx Spartan 3 FPGA 的 传播 延迟 和 最 小 延迟 分 别 是 0. 61 ns 和 0. 30ns。 

触发 器 的 传播 延迟 和 最 小 延迟 分 别 是 0.72ns 和 0. 50ns。 建 立时 间 和 保持 时 间 分 别 是 

0. 53ns 和 Ons, 

(a) 如 果 你 设计 一 个 需要 运行 在 40MHz 的 系统 ， 则 在 2 个 触发 器 之 间 需 要 使 用 多 少 个 
连续 的 CLB? 假设 在 CLB 之 间 没 有 时 钟 俩 移 ， 没 有 连 线 延 迟 。 

(b) 假设 在 触发 右 之 间 的 所 有 路 径 上 至 少 通过 一 个 CLB, FPGA 有 多 少时 钟 偏 移 而 不 破 
坏 保持 时 间 约 束 ? 

由 一 对 触发 器 建立 的 同步 器 ， 其 中 few =50ps, To =20ps、7 =30ps。 它 对 每 秒 变 10 次 

的 异步 输入 进行 采样 。 这 个 同步 器 的 最 小 时 钟 周 期 是 多 少 才能 达到 100 年 的 MTBF。 

设计 一 个 接收 异步 输入 的 同步 器 ， 其 MTBF 为 50 年 。 系 统 运 行 主 频 为 1CHz， 采 用 7 = 

110ps，7 =100ps, tou =70ps 的 触发 硕 进 行 采 样 。 同 步 器 每 秒 接 收 0.5 次 的 异步 输入 

(每 2 秒 1 次 )。 满 足 这 个 MTBF 的 失效 概率 是 多 少 ? 在 读 出 采样 输入 信和 号 前 将 等 待 多 少 





图 3-75 2 位 加 法 器 的 电路 图 
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个 时 钟 周期 才能 满足 这 个 失效 概率 ? 

3. 38 当 你 沿 着 走廊 走时 遇见 你 的 实验 室 伙 伴 正 朝 另 一 个 方向 走 。 你 们 两 个 的 第 一 步 在 同一 
条 路 上 。 然 后 你 们 两 个 同时 踏 上 另 一 条 路 。 然 后 你 们 两 个 都 等 一 会 儿 ， 希望 男 一 个 人 到 
另 一 边 。 你 可 以 用 亚 稳 态 的 观点 为 这 种 情景 建 模 ， 并 将 相同 的 理论 应 用 到 同步 部 和 触发 
器 中 。 假 设 你 为 你 和 你 的 实验 室 伙 伴 建立 了 一 个 数学 模型 。 你 们 在 亚 稳 态 状 态 中 相遇 。 


在 上 秒 后 ， 你 保持 这 种 状态 的 概率 是 e-* ，r 表示 你 的 反应 速度 。 今 天 因为 缺乏 睡眠 你 
的 大 脑 变 得 很 模糊 ，r = 20 秒 。 
(a) 需要 多 长 时 间 ， 有 99% 的 可 能 性 你 从 亚 稳 态 中 出 来 ( 即 穿 过 对 方 )? 
(b) 你 不 仅 没有 休息 而 且 很 饿 。 实 际 上 ， 如 果 在 3 分 钟 内 没 到 咖啡 屋 ， 你 将 饿 死 。 你 的 
实验 室 伙 伴 不 得 不 把 你 推进 太平 间 的 概率 是 多 少 ? 

3.39 ”你 使 用 7, =20ps，r =30ps 的 触发 器 建立 了 一 个 同步 器 。 你 的 老板 需要 将 MTBF 增加 10 
倍 ， 你 需要 将 时 钟 频率 升 高 多 少 ? 

3.40 Ben 发 明了 一 个 改进 的 同步 器 ， 如 图 3-76 所 示 。 他 宣布 在 一 个 CLK CLK 
周期 内 消除 亚 稳 态 。 他 解释 在 盒子 M 中 的 电路 是 一 个 逻辑 亚 稳 pM Mo 
态 的 检测 器 。 如 果 输 入 电压 在 禁止 区 域 Vy, ~ Vi 之 间 ， 则 产生 A 
一 个 高 电 平 的 输出 。 通 过 检测 ， 亚 稳 态 检测 器 可 以 确定 第 一 个 
触发 器 是 否 产生 了 一 个 亚 稳 态 的 输出 D2。 如 果 是 ， 则 它 异步 复 图 3-76 “新 型 和 改进 ” 
位 触发 器 ， 使 D2 =0。 第 二 个 触发 虽 对 D2 进行 采样 , 在 Q 上 总 的 同步 器 
是 可 以 产生 一 个 有 效 逻 辑 电 平 。Alyssa 告诉 Ben， 电 路 中 存在 
一 个 错误 ， 因 为 消除 亚 稳 态 就 像 制 造 永 动机 机 一 样 不 可 能 。 谁 是 正确 的 ? 解释 并 说 明 

Ben 或 Alyssa 的 错误 。 


面试 问题 
下 述 问 题 在 数字 设计 工作 的 面试 中 曾经 被 提问 。 
3.1 画 一 个 状态 机 ， 它 用 于 检测 接收 到 的 串 行 输入 序列 01010。 
3.2 设计 一 个 串 行 (每 次 一 位 ) 二进制 补 码 有 限 状 态 机 。 它 有 两 个 输入 Start 和 4， 一 个 输出 Qo 
输入 4 是 一 个 从 最 低 有 效 位 开始 的 任意 长 度 的 二 进 制 数 。 在 相同 的 周期 内 ，Q 输出 相应 
的 位 。 在 输入 最 低 有 效 位 前 ，Start 保持 一 个 周期 有 效 以 便 初 始 化 有 限 状 态 机 。 
3.3 锁 存 器 和 触发 器 有 什么 不 同 ? 它们 各 自在 哪 种 环境 中 更 可 取 ? 
3.4 设计 一 个 5 位 计数 器 有 限 状态 机 。 
3.5 设计 一 个 边沿 检测 器 电路 。 在 输入 从 0 转变 成 1 后 ， 在 一 个 周期 内 输出 应 该 为 高 电 平 。 
3.6 描述 流水 线 的 概念 ， 为 什么 使 用 流水 线 ? 
3.7 描述 触发 器 负 保 持 时 间 的 意思 是 什么 ? 
3.8 图 3-77 给 出 了 信号 4 的 波形 ， 设 计 一 个 电路 ， 使 它 产生 信和 号 B。 
hp a he a 
AOL 
图 3-77 信和 号 的 波形 


3.9 考虑 两 个 寄存 器 之 间 的 组 合 逻辑 快 。 解 释 时 序 约束 。 如 果 你 给 接收 需 方 (第 二 个 触发 器 ) 
171 的 时 钟 输 入 增加 一 个 缓冲 器 ， 那 么 建立 时 间 约 束 是 变 好 了 还 是 变 坏 了 ? 
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4.1 引言 


到 现在 为 止 ， 我 们 在 原理 图 层面 集中 讨论 了 组 合 电路 和 时 序数 字 
电路 的 设计 。 需 通过 手工 简化 真 值 表 和 布尔 表达 式 的 方法 来 寻找 一 套 
有 效 的 逻辑 门 电路 来 实现 给 定 功 能 。 同 时 还 需要 手工 将 有 限 状 态 机 转 
换 为 逻辑 门 。 这 个 过 程 非常 麻烦 ， 而 且 还 容易 出 错 。 在 20 世纪 90 年 
KR, 设计 人 员 发 现 如 果 他 们 工作 在 更 高 的 抽象 屋 ， 只 说 明 逻 辑 功 能 ， 
同时 引入 计算 机 辅助 设计 (Computer- Aided Design，CAD) 工 具 来 生成 优 
化 的 门 电 路 ， 那 么 可 以 获得 更 高 的 设计 效率 。 这 些 对 硬件 的 说 明 通 常 
由 硬件 描述 语言 (Hardware Description Language, HDL) 4 Ho MEA M 
种 主要 的 硬件 描述 语言 ， 它 们 分 别 是 SystemVerilog 和 VHDL, 

SystemVerilog 和 VHDL 的 基本 原理 很 相似 。 但 是 两 者 的 语法 却 有 所 
不 同 。 在 本 章 中 ， 当 讨论 这 两 种 语言 时 ， 我们 会 把 SystemVerilog 放 在 
上 面 ，VHDL 放 在 下 面 ， 进 行 比较 。 当 你 第 一 次 阅读 本 章 时 ， 只 需要 关 
注 其 中 一 种 语言 。 掌 握 一 种 语言 后 ， 在 需要 时 也 可 以 很 快 掌握 另 一 种 
语言 。 

后 续 章 节 的 硬件 将 以 电路 图 和 HDL 两 种 形式 表示 。 如 果 你 选择 跳 
过 本 章 ， 不 学 习 硬 件 描 述 语 言语 言 ， 仍 然 可 以 在 电路 图 中 掌握 计算 机 
组 成 的 基本 原理 。 然 而 ， 现 在 大 部 分 的 商业 系统 都 是 使 用 HDL 语言 进 
行 设计 ， 而 不 是 原理 图 。 如 果 你 希望 在 专业 生涯 中 从 事 电子 设计 工作 ， 
我 们 希望 你 可 以 学 习 一 门 硬 件 描述 语言 。 


4. 1.1 模块 


包括 输入 和 输出 的 硬件 块 称 为 模块 (module)。 与 门 、 复 用 器 和 优先 级 电路 都 是 硬件 模块 的 例 
子 。 描 述 模块 功能 的 主要 形式 有 两 种 : 行为 模型 (behavioral) 和 结构 模型 (structural ) 。 行 为 模型 描 
述 一 个 模块 做 什么 。 结 构 模 型 应 用 层次 化 方法 描述 一 个 模块 怎样 由 更 简单 的 部 件 构造 。 例 4.1 中 
的 SystemVerilog 和 VHDL 代码 给 出 了 描述 例 2. 6 中 布尔 函数 y =a b c +a b c +a bc 的 模块 。 在 
两 种 语言 中 ， 模 块 都 命名 为 sillyfunction, 具有 3 个 输入 a、b 和 c， 以 及 一 个 输出 yo 

正如 你 所 预期 的 ， 模 块 是 模块 化 的 一 个 好 应 用 。 它 很 好 地 定义 了 由 输入 和 输出 组 成 的 接 
口 ， 并 且 它 执行 特定 功能 。 而 且 其 编码 内 容 对 于 调用 该 模块 的 其 他 模块 并 不 重要 ， 只 要 它 执行 
自己 的 功能 。 


4. 1.2 硬件 描述 语言 的 起 源 


在 这 两 种 硬件 描述 语言 的 选择 上 ， 大 学 几乎 选择 一 种 语言 在 课堂 上 讲授 。 而 工业 界 则 倾 癌 
于 使 用 SystemVerilog ， 但 是 很 多 公司 仍然 使 用 VHDL， 很 多 设计 工程 师 需要 熟练 掌握 两 种 语言 。 
VHDL 作为 一 个 由 委员 会 提出 的 语言 ， 它 比 SystemVerilog 的 语句 宛 长 且 不 灵活 。 
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SystemVerilog 
module sillyfunction(input Jogica, b,c, 
Output logic y); 


assign y=~a & ~b & ~c | 
a&~b&~c | 
a&~b& ci 


endmodule 


一 个 SystemVerilog 模块 以 模块 名 、 以 及 输入 
和 输出 列表 开始 。assign 语句 描 “ 述 组合 逻 辑 。 
~ 表示 非 , 《表示 与 ， | 表示 或 。 

输入 、 输 出 等 logic 信号 是 布尔 变量 (0 和 
1)。 它 们 也 有 浮 点 值 和 未 定义 的 值 ， 这 些 将 在 
4.2.8 节 中 讨论 。 

logic 变量 类 型 首次 在 SystemVerilog 中 引 
入 ， 它 取代 reg 变量 类 型 ，reg 在 Verilog 语言 中 
长 期 导致 概念 混 消 的 来 源 。1logic 变量 类 型 可 以 
用 于 任何 地 方 ， 除 了 具有 多 个 驱动 的 信号 外 。 具 
有 多 个 驱动 器 的 信号 称 为 net， 这 将 在 4.7 节 中 


讨论 。 


B 
` 
Hk 


组 合 逻 辑 
VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 
entity sillyfunction is 
port(a, B, c: in STD_LOGIC; 


yi: out STD_LOGIC); 
end; 


architecture synth of sillyfunction is 
begin 
y <= (not a and not b and not c) or 
(a and not b and not c) or 
(a and not b and c); 
end; 

VHDL 代码 有 3 个 部 分 : 1ibrary( 库 ) 调 用 子 句 、entity 
(实体 ) 声 明和 architecture( 结 构 ) 体 。library WHATA 
将 在 4.7.2 节 中 讨论 。entity 声明 列 出 模块 名 、 输 入 和 输出 。 
architecture 体 定 义 模块 做 什么 。 

VHDL 信号 (如 输入 或 输出 ) 必 须 有 类 型 声明 。 数 字 信 号 必 
须 声明 为 STD_LOGIC 类 型 。sTD Locic 信号 可 以 有 “0” 或 
“1” 的 值 ， 以 及 浮 点 值 或 未 定义 的 值 ， 这 些 将 在 4.2.8 节 中 讨 
论 。STD LOGIC 在 库 IEEE. STD_LOGIC 1164 PHM, PLA 
必须 调用 这 个 库 。 

VHDL 在 与 (AND) 和 或 (OR ) 运算 之 间 没 有 默认 的 运算 顺 
序 ， 所 以 布尔 表达 式 必 须 添 加 括号 。 


两 种 语言 都 足以 描述 任何 的 硬件 系统 ， 也 都 各 目 有 自己 的 特点 。 一 门 最 好 的 语言 就 是 在 你 
的 环境 里 已 经 使 用 的 语言 或 者 是 客户 要 求 使 用 的 语言 。 当 前 的 大 部 分 计算 机 辅助 设计 工具 都 允 
许 混 合 使 用 两 种 语言 ， 不 同 的 模块 可 以 用 不 同 的 语言 描述 。 


SystemVerilog 

Verilog 由 Gateway Design Automation 公司 于 
1984 年 作为 一 个 逻辑 模拟 的 专利 语言 开发 的 。 
Gateway 公司 于 1989 年 被 Cadence 公司 收购 ， 在 
Open Verilog International 组 织 的 控制 下 ，Verilog 
于 1990 年 成 为 一 个 公开 的 标准 ，1995 年 成 为 
IEEE pry", Verilog 语言 于 2005 年 进行 扩展 使 
其 特征 简化 ， 并 更 好 地 支持 模块 化 设计 与 系统 验 
证 。 这 些 扩展 融入 一 个 语言 标准 中 ， 这 就 是 Sys- 
temVerilog( IEEE STD 1800- 2009 ) 。 SystemVerilog 
文件 名 通常 以 . sv 结束 。 


4.1.3 模拟 和 综合 


VHDL 

VHDL 是 VHSIC Hardware Description Language 的 简写 。VH- 
SIC 是 美国 国防 部 Very High Speed Integrated Circuits 程序 的 缩写 ， 

VHDL 最 初 是 于 1981 年 由 美国 国防 部 开发 ， 目 的 在 于 描述 
硬件 的 结构 和 功能 。 它 由 Ada 编程 语言 发 展 而 来 。VHDL 最 初 
预想 是 用 作文 档 化 ， 但 是 很 快 就 改 为 用 作 模 拟 和 综合 。IEEE 于 
1987 年 将 其 标准 化 ， 之 后 又 多 次 更 新 了 这 个 标准 。 本 章 的 内 容 
是 基于 2008 年 修订 的 VHDL 标准 (IEEE STD 1076-2008) ， 该 修 
订 版 用 多 种 方式 简化 VHDL 语言 。 在 写本 书 时 ， 并 不 是 所 有 的 
VHDL 2008 的 功能 都 被 CAD 工具 支持 ; 因此 本 章 内 容 只 使 用 那 
些 能 被 Synplicity 、Altera Quartus 和 ModelSim 支持 的 功能 。VHDL 
文件 名 通常 以 . wha 结束 。 


两 种 硬件 描述 语言 的 主要 目的 是 逻辑 模拟 (simulation) 和 综合 (synthesis)。 在 模拟 阶段 ， 给 
模块 增加 输入 ， 并 检查 输出 以 便 验证 模块 操作 是 否 正 确 。 在 综合 阶段 ,将 模块 的 文字 描述 转换 


成 逻辑 门 。 
1. 模拟 


人 类 周而复始 地 制造 错误 。 这 些 错 误 在 硬件 设计 里 称 为 漏洞 (bug) 。 显 然 ， 去 除数 字 系 统 


O 电气 电子 工程 师 学 会 (IEEE) 是 一 个 专业 协会 ， 负 责 很 多 计算 标准 包括 Wi-Fi (802. 11) 、 以 太 网 (802.3 ) 和 


浮 点 数 (754)。 
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PRERE, RI ae 4 FE LEE TT ie RC AE EET PE ER ERT. TE 
实验 室 测 试 一 个 系统 是 很 花费 时 间 的 。 而 实验 室 发 现 引 起 错误 的 原因 可 能 非常 困难 ， 因 为 只 有 
发 送 到 芯片 管 脚 的 信号 才能 观察 到 。 没 有 方法 直接 观察 芯片 中 发 生 了 什么 。 在 系统 完成 后 才 改 
正 错 误 付出 的 代价 极度 昂贵 。 例 如 ， 改 正 一 个 尖端 集成 电路 中 的 错误 将 花费 数 百 万 美元 并 耽误 
数 月 的 时 间 。 英 特 尔 公司 的 奔腾 处 理 器 曾经 出 现 过 一 个 声名 狼藉 的 浮 点 除法 (floating point divi- 
sion，FDIV ) 漏 洞 ， 迫 使 公司 在 交 货 之 后 又 重新 召回 芯片 ， 总 共 花 费 了 4.75 亿美 元 。 可 见 在 系 
统 建立 前 进行 逻辑 模拟 是 很 必要 的 。 

图 4-1 显示 了 前 面 siLlyfunction 模块 的 
模拟 波形， 说 明 模 块 工作 正常 。 正 如 布尔 表达 
式 表 示 的 ， 当 a、b 和 c 4000, 100 和 101 时 ， 
y 的 值 是 TRUE。 

2. 综合 

逻辑 综合 将 HDL 代码 转换 成 网 表 (netlist ) , 
网 表 描 述 硬 件 ( 例如， 逻辑 门 和 连接 它们 的 线 )。 
逻辑 综合 可 以 进行 优化 以 便 减 少 硬 件 的 数量 。 网 
表 可 以 是 一 个 文本 文件 ， 也 可 以 用 原理 图 的 形式 
绘制 出 来 ， 使 电路 可 视 化 。 图 4-2 显示 了 综合 
sillyfunction 模块 的 结果 。 注 意 , 3 个 3 输 
入 与 门 怎样 简化 为 2 个 2 输入 与 门 , 与 例 2.6 中 
使 用 的 布尔 代数 化 简 一 样 。 

HDL 中 的 电路 描述 与 编程 语言 中 的 代码 很 相似 。 然 而 ， 必 须 记 住 这 里 的 代码 用 来 代表 硬件 。 
SystemVerilog 和 VHDL 是 具有 丰富 命令 的 语言 。 并 不 是 所 有 的 命令 都 可 以 综合 成 人 硬件。 例如， 在 
模拟 时 ， 在 屏幕 上 输出 结果 的 命令 就 不 能 转换 成 硬件 。 因 为 我 们 的 主要 兴趣 是 构建 硬件 ， 所 以 
我 们 将 强调 语言 中 的 可 综合 子 集 。 具 体 地 ， 我 们 将 把 HDL 代码 分 成 可 综合 (synthesizable ) 模块 
和 测试 程序 (testbench) 。 可 综合 模块 描述 硬件 ， 测 试 程序 包含 将 输入 应 用 于 模块 的 代码 ， 检 测 
输出 结果 是 否 正确 ， 并 输出 期 望 结 果 与 实际 结果 的 差别 。 测 试 程 序 代 码 只 用 以 模拟 ， 而 不 能 用 
于 综合 。 、 

对 于 初学 者 来 说 ， 最 常见 的 错误 就 是 认为 HDL 是 计算 机 程序 而 不 是 描述 数字 硬件 的 快速 
方法 。 如 果 不 能 大 致 了 解 HDL 要 综合 的 硬件 ， 则 很 可 能 不 会 得 到 满意 的 结果 。 可 能 创建 多 余 
的 硬件 ， 也 可 能 写 出 了 一 个 模拟 正确 但 却 不 能 在 硬件 上 实现 代码 。 因 此 ， 应 该 以 组 合 逻 辑 块 、 
寄存 器 、 有 限 状态 机 的 形式 考虑 系统 。 在 开始 编写 代码 前 ， 首 先 在 纸 上 描 绘 这 些 模块 ， 并 看 看 
它们 是 怎样 连接 的 。 

根据 我 们 的 经 验 ， 初 学 者 学 习 HDL 的 最 好 方法 就 是 在 例子 中 学 习 。HDL 有 一 些 特定 的 方 
法 来 描述 各 种 的 逻辑 ， 这 些 方法 称 为 风格 (idiom) 。 本 章 将 讲述 如 何 针 对 每 一 类 模块 采用 合适 
的 风格 编写 HDL 代码 ， 然 后 如 何 把 各 块 聚 集 起 来 成 为 一 个 可 以 工作 的 系统 。 当 需要 摘 述 一 个 
特别 类 型 的 硬件 时 ， 首 先 需要 查看 相似 的 例子 ， 然 后 修改 例子 使 之 适合 特定 的 需要 。 我 们 不 会 
严格 地 定义 所 有 的 HDL 语法 ， 因 为 那 是 十 分 无 聊 的 ， 而 且 这 样 会 使 大 家 把 HDL 看 作 一 个 编程 
语言 ， 而 不 是 一 个 对 硬件 的 描述 。IEEE SystemVerilog 和 VHDL 规范 以 及 大 量 枯燥 但 详尽 的 书籍 





图 4-2 综合 后 的 电路 


加 ”模拟 是 使 用 ModelSim PE 学 生 版 本 10. Oc 来 运行 的 。 选 择 使 用 ModelSim 是 因为 尽管 它 是 商业 软件 ， 但 一 个 
学 生 版 本 仍然 可 容纳 10 000 行 免费 代码 。 

© ”综合 是 使 用 Synplicity 的 Synplify Premier 来 执行 的 。 选 择 这 个 工具 是 因为 它 是 行业 领先 的 用 于 综合 HDL 到 现 
场 可 编程 逻辑 门 阵列 (参见 5.6.2 节 ) 的 商业 软件 ， 也 因为 它 对 高 校 使 用 的 收费 不 贵 。 
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包括 了 所 有 细节 ， 它 们 可 以 帮助 你 在 特别 的 主题 上 获得 更 多 信息 (参见 在 书后 补充 阅读 部 分 ) 。 
4.2 组合 逻 辑 


我 们 一 直 在 学 习 如 何 设计 由 组 合 逻 辑 和 寄存 器 组 成 的 同步 时 序 电 路 。 组 合 逻辑 的 输出 只 依 
赖 当前 输入 。 本 节 描 述 如 何 用 HDL 编写 组 合 逻 辑 的 行为 模型 。 


4.2.1 位 运算 符 


位 (bitwise) 运 算 符 对 单位 信号 和 多 位 总 线 进行 操作 。 例 如 ， 在 HDL 例 4.2 中 的 模块 inv 
描述 4 个 连接 到 4 位 总 线 的 反 向 器 。 


HDL 例 4.2 RAS 
SystemVerilog VHDL 
module inv(input logic [3:0] a, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
output logic [3:0] y}; 
entity inv is 
assign y=~a; port(a: in STD_LOGIC_VECTOR(3 downto 0); 
endmodule y: out STD_LOGIC_VECTOR(3 downto 0)): 


al3:0] 代 表 一 个 4 位 的 总 线 。 这 些 位 从 “ H 
最 高 有 效 位 到 最 低 有 效 位 分 别 是 a[3]、a en oe synth of inv is 


[2] 、a[1] 、a[0]。 因 为 这 里 最 低 有 效 位 的 y <= not a; 

位 号 最 小 ， 所 以 称 为 小 端 (little - endian ) 顺 end: 

序 。 也 可 以 把 总 线 命名 为 a[4 :1]。 这 样 ，a VHDL 使 用 STD LOGIC VECTOR 代表 STD_LOGIC MA. STD_ 

[4] 就 在 最 高 有 效 位 。 或 者 ， 可 以 用 a [0: LOGIC_VECTOR (3 down TO 0) 代表 一 个 4 位 总 线 。 从 最 高 有 效 位 

3] ， 这 样 ， 位 从 最 高 有 效 位 到 最 低 有 效 位 分 。 到 最 低 有 效 位 的 位 分 别 是 a (3) 、a (2)、a (1)、a (0)。 因 为 最 低 

别 为 a[0]、a [1]、a[2]、a[3]。 这 称 作 有 效 位 的 位 号 最 小 ， 所 以 称 为 小 端 (little-endian ) 顺序 。 也 可 以 声明 

大 端 (big 一 endian) 顺 序 。 总 线 为 STD LOGIC VECTOR(4 downto 1) 。 这 样 ， 第 4 位 就 成 为 
最 高 有 效 位 。 还 可 以 写 为 STD LOGIC VECTOR (0 to 3) 。 这 样 ， 从 
最 高 有 效 位 到 最 低 有 效 位 就 是 a (0)、a (1)、a (2)、a (3)。 这 称 
为 大 端 (big-endian) 顺序 。 


[3:0] [3:0] 
ao) > >. eo 
y[3:0] 
图 4-3 inv 综合 后 的 电路 


总 线 的 字 节 顺序 (endianness ) 是 任意 选择 的 。 实 际 上 ， 在 上 面 例子 中 ， 字 节 顺 序 并 不 重要 ， 
因为 这 一 组 反 相 融 并 不 关心 字 节 顺序 。 字 节 顺 序 与 运算 符 有 关 ， 例 如 ， 在 加 法 中 要 把 一 列 的 进 
位 输出 到 下 一 列 中 。 只 要 保持 一 致 ， 可 以 采用 任意 一 种 字 节 顺序 。 我 们 将 一 直 沿 用 小 端 顺序 ， 
对 于 W 位 总 线 ， 在 SystemVerilog 中 是 [N -1:0] ,在 VHDL 中 是 (N -1 downto 0). 

本 章 中 的 代码 例子 都 是 用 Synplify Premier 综合 工具 从 SystemVerilog 代码 生成 的 原理 图 。 
图 4-3 显 示 了 inv 模块 综合 为 4 个 反 相 器 ， 用 反 相 屁 符 号 y [3:0] 标 识 。 反 相 器 连接 4 位 输入 
和 输出 总 线 。 相 似 的 硬件 也 可 从 可 综合 的 VHDL 代码 中 产生 。 

HDL fj 4.3 中 的 gates 模块 表示 在 4 位 总 线 上 的 按 位 运算 实现 其 他 基本 逻辑 功能 。 


4. 2.2 注释 和 空白 


上 面 的 gates 例子 展示 了 如 何 注释 。SystemVerilog 和 VHDL 对 空白 并 不 敏感 ( 即 ， 空 格 、 
Tab 键 、 换 行 )。 然 而 ,合理 使 用 缩 进 排版 和 换行 可 以 增加 复杂 设计 的 可 读 性 。 注 意 在 给 信号 
和 模块 命名 时 ， 使 用 大 写字 母 和 下 划 线 。 本 书 使 用 所 有 的 小 写字 母 模 块 名 和 信号 名 不 能 以 数字 
开头 。 
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HDL $4.3 逻辑 门 


SystemVerilog 


module gates(input logic [3:0] a4, b, 
output logic [3:0] yl y2. 
y3, y4, y5); 


/* five different two-input Togic 
gates acting on 4-bit busses */ 
assign yl=a&b; // AND 
assign y2=a | b; // OR 
assign y3=a ^ b; // XOR 
assign y4=~(a&b); // NAND 
assign y5=~(a |b); // NOR 
endmodule 
~, ^M | 都 是 Verilog 运算 符 (operator) ， 而 a, b 
和 yl 是 运算 数 (operand ) 。 运 算 符 和 运算 数 的 组 合 ， 
如 asb IÈ ~ (a lb) ， 称 为 表达 式 (expression)。 一 条 完 
整 的 命令 ， 如 assign y4 = ~ (asb); RAKES 
(statement ) 。 
assign out = inl op in2; 称 为 连续 赋值 语句 
(continuous assignment statement) 。 连 绪 赋 值 语 句 以 一 
个 分 号 ( ; ) 结 束 。 在 连续 赋值 语句 中 ， 等 号 右边 的 输 
入 值 改 变 ， 等 号 左边 的 输出 就 会 随 之 重新 计算 。 因 此 ， 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.al1; 


entity gates is 
port(a, b: in STD_LOGIC_VECTOR(3 downto 0); 
yl, y2, y3, y4, 
y5: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 


architecture synth of gates is 
begin 
-~ five different two-input logic gates 
-- acting on 4-bit busses 
yl <=aandb; 
y2 <=a‘or b; 
y3 <= a xor D; 
y4 <= a nand b; 
y5 <= a nor b; 
end; 


not , xor 和 or 都 是 VHDL i& #4 (operator), a, b 
和 yl 是 运算 数 (operand) 。 运 算数 和 运算 符 的 组 合 ， 如 a 
and b 或 a nor b， 称 为 表达 式 (expression ) 。 一 条 完整 的 
命令 ， 如 y4 < = anand b; 称 为 语句 (statement ) 。 

out < = inl op in2; 称 为 并 发 信号 赋值 语句 (concur- 
rent signal assignment statement), VHDL 赋值 语句 以 一 个 分 
号 ( 和 结束 。 在 并 发 信号 赋值 语句 中 ， 等 号 右边 的 输入 值 
改变 ， 等 号 左边 的 输出 就 会 随 之 重新 计算 。 因 此 ， 并 发 信 
号 赋值 语句 描述 组 合 逻 辑 。 


xD 


y3[3:0] 


>— ET EO 
y4[3:0] 
3:0 
FBIS 
>— E E 
y5[3:0] 
3:0 
0 ~ 


4-4 gates 综合 后 的 电路 


连续 赋值 语句 描述 组 合 逻 辑 。 
3:0]| |[3:0] 
| a[3:0] 一 
iso Ae 
y1[3:0] 
3:0 
Boal) > 
y2[3:0] 
SystemVerilog 


SystemVerilog 的 注释 与 C 和 Java 的 一 样 。 注 释 以 / 
* 开始 ， 之 后 的 内 容 可 以 延续 多 行 ， 以 下 一 个 * / 结 
束 。 以 / /开始 的 注释 则 一 直 延 续 到 本 行 的 末尾 。 

SystemVerilog 是 大 小 写 敏感 的 。yl 和 Y1 在 Sys- 
temVerilog 中 被 认为 是 不 同 的 信号 。 然 而， 只 通过 大 小 
写 的 不 同 来 区 分 不 同 的 信号 容易 造成 混乱 。 


VHDL 
注释 以 /* 开始 ， 之 后 的 内 容 可 以 延续 多 行 ， 以 下 一 个 
* /结束 。 以 - -开始 的 注释 则 一 直 延 续 到 本 行 的 末尾 。 
VHDL 是 大 小 写 不 敏感 的 ，y1 和 Y1 在 VHDL 语言 中 
是 相同 的 信号 。 然 而 ， 其 他 读 取 文 件 的 工具 可 能 是 大 小 写 
敏感 的 ， 如 果 轻 易 混 用 大 小 写 的 习惯 可 能 带 来 一 些 讨 厌 的 
漏洞 。 


MB tS 


4.2.3 缩 位 运算 符 


缩 位 运算 符 表 示 作 用 在 一 条 总 线 上 的 多 输入 门 。HDL 例 4. 4 描述 了 一 个 8 输入 与 门 ， 其 输 
和 分 别 是 a,，a。,… ，ao。。 或 门 、 异 或 门 、 与 非 门 、 或 非 门 和 同 或 门 也 有 类 似 的 缩 位 运算 符 。 
当 多 输入 异 或 门 进行 奇偶 校 验 时 ， 如 果 奇 数 个 输入 为 TRUE 则 返回 TRUE, 


HDL 例 4.4 8 输入 与 门 


SystemVerilog VHDL 
module and8(input logic [7:0] a， library IEEE; use IEEE.STD_LOGIC_1164.a11; 
output logic y); 


entity and8 is 
assign y=4&a; a port(a: in STD_LOGIC_VECTOR(7 downto 0); 
y: out STD_LOGIC); 


// &a is much easier to write than end; 
// assign y =a[7] & a[6] & a[5] & al4] & 
// a[3] &a(2] & all) & a[0]: architecture synth of and8 is 
endmodule begin 
y <=and a; 


-- and a is much easier to write than 
~~ y <=a(7) and a(6) and a(5) and a(4) and 
a(3) and a(2) and a(1) and a(0); 





4-5 and8 综合 后 的 电路 


4.2.4 条 件 赋值 


条 件 赋 值 (conditional assignment) 根据 称 为 条 件 的 输入 在 所 有 可 选项 中 选择 一 个 输出 。HDL 
例 4.5 说 明了 一 个 使 用 条 件 赋值 的 2:1 复 用 器 。 

基于 HDL 例 4.5 中 的 2:1 复 用 器 的 相同 原理 ，HDC 例 4.6 给 出 了 一 个 4:1 复 用 器 。 图 4-7 
显示 了 一 个 用 Synplify Premier 产生 的 4:1 复 用 器 原理 图 。 这 个 软件 使 用 的 复 用 器 符号 与 本 书目 
前 使 用 的 不 同 。 该 复 用 器 有 多 路 数据 (da) 和 独 热 使 能 (e) 输 入 。 当 一 个 使 能 信号 有 效 时 ， 相 关 
数据 就 传送 到 输出 。 例 如 ， 当 s [1] =s[0] =0 时 ， 底 部 的 与 门 unl s 5 产生 信号 1， 使 能 复 
用 器 的 底部 输入 ， 使 它 选 择 do [3:01]。 


4.2.5 ”内 部 变量 


通常 ， 把 一 个 复杂 功能 分 为 几 个 中 间 过 程 来 完成 会 更 方便 。 例 如 ，5.2. 1 节 描 述 的 全 加 器 
是 一 个 有 3 个 输入 和 2 个 输出 的 电路 。 它 由 以 下 等 式 定义 : 


S=A@BQ@C, 
Con = AB + AC, + BC,, (4-1) 
如 果 我 们 定义 中 间 信 号 已 和 GC, 
P=AQ@B 


G = AB alle 
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HDL $4.5 2:1 复 用 器 


SystemVerilog 

条 件 运算 符 ?: 基 于 第 一 个 表达 式 ， 在 第 二 个 表达 式 
和 第 三 个 表达 式 之 间 选 择 。 第 一 个 表达 式 称 为 条 件 。 如 
果 条 件 为 1， 那 么 运算 符 就 选择 第 二 个 表达 式 。 如 果 条 件 
是 0， 那 么 运算 符 就 选择 第 三 个 表达 式 。 

?: 对 于 描述 复 用 器 特别 有 用 ， 因 为 它 根 据 第 一 个 输 
A, 在 其 他 两 个 表达 式 中 选择 。 下 面 的 代码 说 明 使 用 条 
件 运 算 符 实现 具有 4 位 输入 的 2:1 复 用 器 的 风格 。 


module mux2(input logic [3:0] d0. dl, 
input logic Ba 
output logic [3:0] y); 


assign y=s ?d1: d0; 
endmodule 
如 果 s Al, 那么 Yy=dl。 如 果 s HO, 那么 y=d0。 
?: 也 称 为 三 元 运算 符 ， 因 为 它 有 3 个 输入 。 在 C 和 
java 编程 语言 中 ， 它 也 有 相同 的 用 途 。 


VHDL 

条 件 信 号 赋值 基于 不 同 的 条 件 执行 不 同 的 运算 。 在 
描述 复 用 器 时 它们 特别 有 用 。 例 如 ，2:1 复 用 器 可 以 使 
用 条 件 信号 赋值 从 2 个 4 位 输入 中 选择 一 个 。 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux2 is 
port(dO, dl: in STD_LOGIC_VECTOR(3 downto 0); 
S: in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 


architecture synth of mux2 ís 
begin 

y <=dl whens else d0; 
end; 


如 果 s 为 1， 条 件 信号 赋值 把 dl KA yo AM, 4E 
do 赋 给 yo 注意 ,在 VHDL 2008 修订 版 之 前 ,在 代码 
中 必须 写 上 when s = '1'， 而 不 是 when s, 





y[3:0] 


图 4-6 mux2 综合 后 的 电路 


HDL 例 4.6 4:1 复 用 器 


SystemVerilog 

一 个 4:1 SEA RE AT A REA ARSE, A 4 个 输 
大 中 选择 1 个 。 
module mux4(input logic [3:0] d0, dl, d2, d3, 


input logic [1:0] s, 
output logic [3:0] y); 


assign y=s{1] ? (s[0] ? d3 : d2) 
: SLO ,3 d1 09 ， 
endmodule 
如 果 s [1] 为 1, 那么 复 用 器 选择 第 一 个 表达 式 
(s[0]? d3 :d2 )。 表 达 式 基于 s [0] 依 次 选择 d3 或 者 
d2( 如 果 s[0] 为 1，y=d3; 如 果 s[0] 为 0, y=d2)。 
如 果 s [1] 为 0, 复 用 器 选择 第 二 个 表达 式 ， 这 时 基于 
s [0 1] 选择 dl 或 者 do. 


VHDL 

一 个 4:1 复 用 器 使 用 多 个 else 子 句 从 4 个 输入 中 
选择 1 个 。 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux4 is 


port(d0, dl, 
d2, d3: in STD_LOGIC_VECTOR(3 downto 0); 
$< in STD _LOGIC_VECTOR(1 downto 0); 
y: out STD_LOGIC_VECTOR(3 downto 日) ) 
end; 


architecture synthl of mux4 is 
begin 
y <= d0 when s="00" else 
dl when s="01" else 
d2 when s="10" else 
d3; 
end; 


VHDL 也 支持 选择 信号 赋值 语句 (selected signal as- 
signment ) 以 便 提供 从 多 个 可 能 值 中 选择 一 个 的 简便 方 
法 。 这 与 在 一 些 编程 语言 中 使 用 switch/case 语句 代 
替 多 个 if/else 语 名 相似 。4:1 复 用 器 可 以 用 选择 信号 
赋值 语句 重新 写 出 : 


architecture synth2 of mux4 is 
begin 
with s select y <= 
d0 when "00", 
dl when "01", 
d2 when "10", 
d3 when others; 
end; 
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图 4-7 mux4 综合 后 的 电路 
WU By IESER: 
A ; med eA 


已 和 C 称 为 内 部 变量 (internal variable) ， 因 为 它们 既 不 是 输入 也 不 是 输出 ， 只 在 模块 内 
部 使 用 。 它 们 与 编程 语言 中 的 局 部 变量 相似 。HDL 例 4.7 说 明了 在 HDL 中 如 何 使 用 内 部 


变量 。 : 


HDL 赋值 语句 (在 SystemVerilog 中 的 assign 和 VHDL 的 < = ) 是 并 行 执行 的 。 这 与 传统 
的 编程 语言 (如 C 和 java) 不 同 ， 在 传统 的 编程 语言 中 ,语句 的 执行 顺序 由 书写 顺序 决定 。 在 传 
统 的 编程 语言 中 由 于 语句 是 顺序 执行 的 ， 所 以 $ = PC 必须 放 在 P=4@B 的 后 面 。 在 HDL 
中 ， 顺 序 并 不 重要 。 与 硬件 一 样 ， 在 右边 的 输入 信和 号 改变 时 赋值 语句 就 会 被 计算 ， 而 不 考虑 赋 


值 语句 在 模块 中 的 出 现 顺 序 。 


HDL 例 4.7 全 加 器 


SystemVerilog 
在 SystemVerilog 中 ， 内 部 变量 通常 用 logic 变量 类 
型 声明 。 
module fulladder(input logic a, b, cin, 
output logic s, cout); 

logic p, g; 

assign p=a ^b; 

assign g=a &b; 

assigni sap Acin; 


assign cout=g | (p&cin); 
endmodule 


VHDL 


在 VHDL t, signal 用 来 代表 内 部 变量 ， 它 们 的 
值 用 并 行 信 号 赋值 语句 定义 ， 如 p< =a xor b; 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity fulladder is 
port(a, b, cin: in STD_LOGIC; 
Ss cout: out STD_LOGIC); 
end; 


architecture synth of fulladder is 
signal p, g: STD_LOGIC; 

begin 
p <= a xor D; 
g <= a and b; 


S <=p xor cin; 
cout <=g or (pand cin); 
end; 
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p unl cout 


4-8 fulladder 综合 后 的 电路 


4.2.6 优先 级 


注意 , 在 HDL 例 4.7 中 为 cout 计算 添加 了 括号 ， 以 便 把 运算 顺序 定义 为 Co =GP. 
Ci) ， 而 不 是 Cu = (G+P)* C;,。 如 果 没 有 使 用 括号 ， 就 采用 语言 定义 的 默认 运算 顺序 。HDL 
例 4. 8 说 明了 两 种 语言 的 运算 符 优 先 级 。 这 个 表 包 括 了 第 5 章 定义 的 算术 运算 符 、 移 位 运算 符 
和 比较 运算 符 。 


HDL 例 4.8 运算 符 优先 级 


SystemVerilog VHDL 
# 4-1 SystemVerilog 运算 符 优 先 级 324-2 VHDL 运算 符 优先 级 
ie” ee eel ae 
H ~ NOT H not NOT 
*,/, % MUL, DIV, MOD i * , /, mod, rem MUL, DIV, MOD, REM 
2 2 es PLUS, MINUS STS PLUS, MINUS 
: 2<, 3 > 逻辑 左 移 /逻辑 右 移 rol, ror, 循环 移 位 ， 逻 辑 移 位 
<<<, >>> 算术 左 移 /算术 右 移 srl, sll 
<, <=, >, >= :相对 比较 L glc, >, >s 相对 比较 
TAE 相等 比较 Re 相等 比较 
了 全 AND, NAND K and, or, nand, ZZA 
pa y er XOR, XNOR t nor, xor, xnor 
š L; ~j OR, NOR 
Aen 条 件 如 你 所 想象 的 ，VHDL 中 的 乘法 比 加 法 有 更 高 的 优 


先 级 。 与 System Verilog 不 同 的 是 ，VHDL 中 的 所 有 逻辑 

如 你 所 想象 的 ,SystemVerilog 中 的 运算 符 优先 级 与 其 运算 符 (and，or 等 ) 有 相同 的 优先 级 ， 这 与 布尔 代数 

他 编程 语言 很 相似 。 特 别 是 ，AND 的 优先 级 比 OR 的 优 不 同 。 因 此 ， 括 号 就 很 有 必要 ， 和 否则 ，cout < = gor 
先 级 高 。 可 以 利用 这 个 优先 级 来 消除 括号 。 p and cin 就 会 被 从 左 到 右 解 释 为 cout < = (gorp) 


assign cout = g |pécin; and cino 


4.2.7 数字 


数字 可 以 采用 二 进 制 、 八 进 制 、 十 进 制 或 者 十 六 进 制 来 表示 (基数 分 别 为 2、8、10 和 
16) 。 此 外 ， 可 以 选择 指定 数字 的 大 小 ， 即 位 数 ， 数 字 的 开头 将 搬入 一 些 0 来 满足 数字 大 小 的 
要 求 。 数 字 中 间 出 现 的 下 划 线 会 被 忽略 ， 但 是 它 可 以 帮助 我 们 把 一 些 长 的 数字 分 成 多 个 部 分 ， 
从 而 加 强 可 读 性 。HDL fi) 4. 9 说 明 在 不 同 语言 中 ， 数 字 是 如 何 书 写 的 。 185 
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HDL $4.9 数字 


SystemVerilog 

声明 常量 的 格式 是 N'Bvalue， 其 中 N 是 位 数 ， 
B 是 说 明基 数 的 字母 ，value 是 值 。 例 如 ，9 'h25 说 
明 一 个 9 位 数字 ， 它 的 值 是 25i6 =37,, = 900100101, , 
SystemVerilog 用 'b 表示 二 进 制 (基数 为 2) ，'o 表示 
八进制 (基数 为 8) ，'d 表示 十 进 制 (基数 为 10) 'h 
表示 十 六 进 制 (基数 为 16) 。 如 果 没 有 提供 基数 ， 那 
么 基数 默认 为 10。 

如 果 没 有 给 出 位 数 ， 那 么 数字 就 赋予 当前 表达 式 
的 位 数 。0 会 自动 填补 在 数字 的 前 面 以 达到 满 位 。 例 
如 ， 如 果 w 是 6 位 总 线 ，assign w = 'bll 就 会 给 
w 赋予 000011。 明 确 地 说 明 位 数 大 小 是 比较 好 的 。 但 
有 个 例外 ，'0 和 '1 分 别 是 将 全 0 和 全 1 赋值 给 一 条 
总 线 的 SystemVerilog 惯用 语法 。 


VHDL 

在 VHDL 中 ，STD_ LOGIC 数字 用 二 进 制 书写 ， 并 且 加 
上 单 引 号 : '0 :和 7" 代表 逻辑 0 和 1。 声 明 STD_ LOGIC_ 
VECTOR 常量 的 格式 是 NB"value" ,其 中 N 是 位 数 ，B 表示 
基数 ，value 是 数字 的 值 。 比 如 ，9x"25" 表 示 一 个 9 位 数 
字 ， 其 数值 是 25,。=37,。=000100101, 。VHDL 2008 使 用 B 表示 
二 进 制 ，O 表示 八进制 ，D 表示 十 进 制 ，x 表示 十 六 进 制 。 

如 果 没 有 写 明 基数 ， 那 么 默认 是 二 进 制 。 如 果 没 有 给 出 
位 数 ， 那 么 该 数字 的 位 数 与 其 数值 所 对 应 的 位 数 一 致 。 截 至 
2011 年 10 A, Synopsys 的 Synplify Premier 工具 尚未 支持 指 
定位 数 。 

others => "0! 和 others = > '1' 分 别 是 将 全 部 位 
赋值 为 0 和 1 的 VHDL 惯用 语法 。 





表 4-3 SystemVerilog 数字 表 4-4 VHDL 的 数字 
数字 位 基数 (I 存储 数字 位 基数 值 存储 
3"b101 3 2 5 101 3B"101" 3 2 5 101 
'b11 ? 2 3 000--- 0011 Bras 2 2 证 
8B"11" 8 2 3 00000011 
O 3 9 See 8B"1010 1011" 8 2 171 1010101 
3"d6 j 3 10 6 110 60"42" 6 8 34 100010 
Beds 6 8 34 100010 8X"~AB" 8 16 171 10101011 
"101" 3 2 5 101 
8 'hAB 8 16 171 10101011 
B"101" 3 2 5 101 
42 ¥ 10 42 00… 0101010 X"AB" 8 16 171 10101011 
4.2.8 Z 和 X 


HDL H z 表示 浮 空 值 。 对 于 描述 三 态 缓存 器 z 尤其 有 用 。 当 使 能 位 为 0 时 ， 它 的 输出 为 浮 
空 。 在 2.6 市 中 ， 总 线 可 以 由 多 个 三 态 缓存 器 驱动 ， 但 其 中 最 多 只 有 一 个 使 能 。HDL 例 4. 10 


展示 了 一 个 三 态 缓存 器 的 风格 。 如 果 绥 存 器 被 使 能 ， 输 入 和 输出 一 致 。 如 果 缓 存 器 被 禁用 ， 输 
出 就 为 浮 空 值 (z) 。 
类 似 地 ，HDL 使 用 x 表示 一 个 无 效 的 逻辑 电 平 。 如 果 一 条 总 线 被 两 个 使 能 的 三 态 缓冲 器 


(或 其 他 门 ) 同时 驱动 为 0 和 1， 则 结果 是 X， 说 明 发 生 了 冲突 。 如 果 驱 动 总 线 的 所 有 三 态 缓冲 
化 同时 为 OFF ， 那 么 总 线 将 用 z 表示 浮 空 。 

在 模拟 开始 时 ， 状 态 结 点 (如 触发 器 输出 ) 被 初始 化 一 个 未 知 状态 (在 SystemVerilog 中 是 
x， 在 VHDL 中 是 u)。 这 对 追踪 由 于 在 使 用 输出 前 忘记 复位 触发 器 而 引起 的 错误 十 分 有 
帮助 。 

如 有 果 一 个 门 接收 一 个 浮 空 输入 ， 当 它 不 能 确认 正确 的 输出 值 时 ， 它 将 产生 一 个 输出 x。 类 
似 地 ， 如 果 它 接收 一 个 无 效 的 或 者 未 初始 化 的 输入 ， 它 也 会 输出 一 个 x。HDL 例 4.11 显示 了 
SystemVerilog 和 VHDL 如 何在 逻辑 门 中 组 合 这 些 不 同 的 信和 号 值 。 

在 模拟 时 看 到 的 x 或 z 值 ， 基 本 已 经 说 明 出 现 了 漏洞 或 不 正确 的 编码 。 在 综合 后 的 电路 
中 ， 这 表示 浮 空 的 门 输入 、 未 初始 化 的 状态 或 内 容 。x 或 u 可 能 被 电路 随机 地 解释 为 0 或 者 1， 
引致 不 可 预测 的 行为 。 
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Li 
HDL $4.10 三 态 缓冲 器 
SystemVerilog VHDL 
module tristate(input logic [3:0] a4, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
sree ett Eels): entity tristate is 
port(a: in STD_LOGIC_VECTOR(3 downto 0); 
assign y=en?a: 4'bz; en: in STD_LOGIC; 
endmodule y: out STD_LOGIC_VECTOR(3 downto 0)); 
注意 y 声明 为 tri 变量 类 型 而 不 是 logic 变量 类 A 
型 logic 信号 只 能 有 一 个 信号 源 驱动 信和 号。 三 态 总 线 ed ern synth of tristate is 
egin 
可 以 有 多 个 驱动 信号 ， 所 以 三 态 总 线 应 声明 为 net 变量 。 y <=a when en else "Z777"; 
在 SystemVerilog 中 net 变量 有 tri 和 trireg 两 种 类 型 。 end; 
一 般 来 说 ， 每 次 只 有 一 个 驱动 信号 源 处 于 激活 状态 ，net 
采纳 该 信号 源 的 数值 作为 其 信号 数值 。 如 果 没 有 一 个 驱 
动 信号 源 处 于 激活 状态 ， 则 tri 类 型 信号 将 处 于 悬空 状 
态 (z)， 而 trireg 类 型 信号 则 保持 先前 的 数值 。 如 果 
输入 或 输出 变量 没有 指定 变量 类 型 ， 则 默认 为 tri 类 
型 。 此 外 ， 一 个 模块 的 tri 输出 可 以 用 作 另 一 个 模块 的 
logic 输 入 。4.7 节 将 进一步 讨论 由 多 个 信号 源 驱动 的 
net 变量 。 
a [3:0] 3:0] 
so) > > T 
y_1[3:0] 
图 4-9 tristate 综合 后 的 电路 
HDL 例 4. 11 未 定义 和 浮 空 输入 的 真 值 表 
SystemVerilog VHDL 
SystemVerilog 信号 值 有 0, 1, z 和 x。 在 需要 时 ， VHDL ġġ STD_ LOGIC 信号 有 “0 1 、 z’ V ax’ 


以 z 或 x 开始 的 SystemVerilog 常量 都 会 用 z 或 者 x( 代 
替 0) 填 充 ， 并 填 满 位 数 。 

表 4-5 列 出 了 使 用 全 部 4 个 可 能 信号 值 的 与 门 真 值 
表 。 注 意 ， 有 时 即使 有 些 输入 是 未 知 的 ， 与 门 也 可 以 决 
定 输出 。 例 如 ，0 &z 返回 0 ， 因 为 与 门 只 要 有 一 个 输入 
为 0， 那么 输出 就 是 0。 另 外 ， 浮 空 或 无 效 的 输入 会 引 
致 无 效 的 输出 ， 在 SystemVerilog 中 用 x 表示 。 


表 4-5 SystemVerilog 中 带 z 和 x 的 


Mu's 

#2 4-6 列 出 了 一 个 使 用 了 所 有 5 个 可 能 信和 号 值 的 与 门 
真 值 表 。 注 意 ， 有 时 即使 有 些 输入 是 未 知 的 ， 与 门 也 可 以 
决定 输出 。 例 如 , "0 ”and“z "返回 0， 因 为 与 门 只 要 有 一 
个 输入 为 "0” ， 那 么 输出 就 是 "0 " 。 另 外 ， 浮 空 或 无 效 的 输 
入 会 引致 无 效 的 输出 ， 在 VHDL 中 用 " x’ 表示。 未 初始 化 
的 输入 会 产生 未 初始 化 的 输出 ， 在 VHDL PI’ u’ 表示 。 


与 门 真 值 表 表 4-6 VHDL 中 带 z 和 x 的 与 门 真 值 表 
"Tn a ee = 
& ae aS n AND 
0 1 Zz X 0 l = 

0 0 0 0 0 0 0 0 0 0 0 
| 0 | - A 1 0 l x x u 
B s 0 z á 5 B z 0 x x x u 
x 0 x x x $ 9 : 4 ; 
u 0 u u u u 


4.2.9 位 混合 


常常 需要 在 总 线 的 子 集 上 操作 ， 或 者 连接 信和 号 来 构成 总 线 。 这 些 操作 称 为 位 混合 (bit swizz- 
ling)。 在 HDL 例 4.12 中 ,用 位 混合 操作 给 y 赋予 9 位 值 c,c,d,d,d,c,101。 
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HDL 例 4.12 位 混合 


SystemVerilog 
assign y={c([2:1], {3{d[0]}}, c[0], 3'b101}; 


{ 1} 操作 符 用 于 连接 总 线 。{3 {ad[0]}} 表 示 d[01 的 3 
个 拷贝 。 

不 要 把 用 b 命名 的 总 线 与 3 位 二 进 制 常量 3'"bl0l 混 
消 。 注 意 ， 指 定常 量 中 3 位 长 度 的 很 重要 ， 否 则 在 y 的 
中 间 就 会 出 现 一 个 以 0 开头 的 未 知 数 。 

MR y 长度 大 于 9 位 ， 将 在 最 高 有 效 位 填充 0。 


4.2.10 延迟 


VHDL 
y <=(c(2 downto 1), d(0), d(0), d(0), c(0), 3B"101"); 

() 聚合 运算 符 用 于 连接 总 线 。y 必须 是 一 个 9 位 的 
STD_ LOGIC_ VECTOR, 

另 一 个 例子 说 明了 VHDL 聚合 的 能 力 。 假 设 z 是 一 
个 8 位 的 STD_ LOGIC_VECTOR， 给 z 赋值 10010110， 
使 用 如 下 命令 聚合 。 


z <= ("10", 4= '1', 2 downto 1 ='1', others ='0') 


“10” MF z 开头 的 两 位 ，z [4]、z [2] 和 z[1] 上 
的 值 为 1， 其余 位 的 值 为 0。 


HDL 的 语句 可 以 与 任意 单位 的 延迟 相关 联 。 这 对 于 在 模拟 预测 电路 工作 速度 ( 若 指定 了 有 
意义 的 延迟 ) 和 调试 需要 知道 原因 和 后 果 时 (如 果 模 拟 结果 中 所 有 信号 同时 改变 ， 则 推断 一 个 
错误 输出 的 根源 就 非常 棘手 ) ， 就 显得 很 有 用 。 在 综合 时 这 些 延 迟 被 忽略 。 综 合 器 产生 的 门 延 
迟 是 由 场 和 i 决定 的 ， 而 不 是 在 HDL 代码 中 的 数字 。 

HDL 例 4.13 给 HDL 例 4.1(y=abc+abc+abc) 的 原始 功能 上 增加 了 延迟 。 假 定 反 相 
器 的 延迟 为 1ns，3 输入 与 门 的 延迟 为 2ns，3 输入 或 门 的 延迟 为 4ns。 图 4-10 显示 了 输入 后 延 





图 4-10 带 延 迟 的 模拟 波形 


(来 自 于 Modelsim 模拟 器 ) 


HDL 例 4. 13 IRA 


SystemVerilog 
“timescale lns/lps 


module example(input logica, b,c, 
output logic y); 


logic ab bb, cb, nl, n2, n3; 


assign #1 {ab, bb, cb}=~{a, b, c}; 

assign #2 nl=ab & bb & cb; 

assign #2 n2=a & bb & cb; 

assign #2 n3=a &bb& c; 

assign #4 y=n1 | n2] n3; 
endmodule 


SystemVerilog 文件 可 以 包括 说 明 每 一 个 时 间 单 位 值 的 
时 间 尺 度 指 令 。 该 语句 的 格式 为 "timescale unit/ 
precision。 在 这 个 文件 中 ， 每 个 时 间 单 位 为 1ns， 模 拟 
精度 为 1ps。 如 果 在 文件 中 没有 给 出 时 间 尺 度 指令 ， 将 使 
用 默认 的 单位 和 精度 (一 般 两 者 都 是 Ins), FE System Ver- 
ilog 中 ，# 符 号 用 于 说 明 延 迟 单位 的 数量 。 它 可 以 放 在 as- 
sign 语句 中 ， 就 像 非 阻塞 ( < =) 和 阻塞 ( =) 赋值 一 
样 ， 这 两 类 语句 将 在 4. 5. 4 节 中 讨论 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity example is 
port(a, b, c: in STD_LOGIC; 
y: out STD_LOGIC); 
end; 


architecture synth of example is 
signal ab, bb, cb, nl, n2, n3: STD_LOGIC; 
begin 
ab <= not a after 1 ns; 
bb <= not b after 1 ns; 
cb <= not c after 1 ns; 
nl <= ab and bb and cb after 2 ns; 
n2 <= a and bb and cb after 2 ns; 
n3 <= a and bb and c after 2 ns; 
y <=nlorn2 or n3after 4 ns; 
end; 


在 VHDL t}, after 子 句 用 于 说 明 延 迟 。 在 这 个 例 
子 中 ， 指 定时 间 单 元 为 纳 秒 。 


4.3 结构 化 建 模 
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上 一 节 讨 论 行为 (behavioral) 建 模 ， 它 通过 对 输入 和 输出 之 间 关 系 建立 模型 。 本 节 介 绍 结 
构建 模 ， 它 描述 一 个 模块 怎样 由 更 简单 的 模块 组 成 。 

例如 ，HDL fil 4. 14 说 明 怎 样 将 3 个 2:1 复 用 器 组 合成 一 个 4:1 复 用 器 。2:1 复 用 器 的 每 个 
拷贝 称 为 一 个 实例 (instance) 。 同 一 个 模 的 多 个 实例 由 不 同 的 名 字 区 分 ， 本 例 中 采用 的 low- 
mux, highmux 和 finalmux。 这 是 一 个 规整 化 的 例子 ， 其 中 2:1 复 用 器 重用 了 多 次 。 


HDL 例 4.14 4:1 复 用 器 的 结构 模型 


SystemVerilog 


module mux4(input logic [3:0] d0, dl, d2, d3, 
input logic [1:0]s, 
output logic [3:0] y}; 


logic [3:0] low, high; 


mux2 lowmux(d0, dl, s[0], low); 

mux2 highmux(d2, d3, SL0], high): 

mux2 finalmux(low, high, s[1], y): 
endmodule 


3 个 mux2 实例 分 别 是 lowmux、highmux 和 
finalmux。mux2 模块 必须 在 SystemVerilog 代码 的 


其 他 部 分 定义 一 一 参考 HDL 例 4.5、HDL fi) 4. 15 或 
HDL 例 4. 34。 





图 4-11 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux4 is 


port(d0, dl, 
d2, d3: in STD_LOGIC_VECTOR(3 downto 0); 
$3 in STD_LOGIC_VECTOR(1 downto 0); 
y: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 


architecture struct of mux4 is 
component mux2 

port(d0， 

dl: in STO_LOGIC_VECTOR(3 downto 0); 
s: in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(3 downto 0)); 
end component; 
signal low, high: STD_LOGIC_VECTOR(3 downto 0); 
begin 
lowmux: mux2 port map(d0, dl, s(0), low); 
highmux: mux2 port map(d2, d3, s(0), high); 
finalmux: mux2 port map(low, high, s(1), y); 
end; 

在 architecture 部 分 必须 先 用 component 声明 语 
句 声明 mux2 端口 。 这 人 允许 VHDL 工具 检查 你 想 使 用 的 组 件 
与 代码 其 他 部 分 声明 的 实体 是 否 具 有 相同 的 端口 ， 从 而 避免 
改变 了 实体 但 没有 改变 实例 而 引起 的 错误 。 然 而 ，compo- 
nent 声明 使 VHDL 代码 变 得 元 长 。 

注意 这 个 mux4 的 architecture 命名 为 struct ， 然 
在 4.2 节 中 ， 带 有 行为 描述 的 模块 的 architecture Ait 
名 为 synth。VHDL 允许 对 同一 个 实体 有 多 个 architec- 
ture( 实现 ) ， 这 些 architecture 用 名 字 区 分 。 名 字 本 
身 对 CAD 工具 没有 什么 意义 ,但 是 struct M synth 比较 
常用 。 可 综合 的 VHDL 代码 一 般 对 每 一 个 实体 中 只 有 一 个 
architecture， 所 以 我 们 不 讨论 在 定义 多 个 architec- 
ture 时 ，VHDL 如 何 设置 的 语法 。 


mux4 综合 后 的 电路 


114 


第 4 章 


HDL 例 4. 15 使 用 结构 建 模 基于 一 对 三 态 缓存 器 建立 了 一 个 2:1 复 用 器 。 不 过 ， 并 不 推荐 


使 用 三 态 缓存 器 来 构建 逻辑 电路 。 


HDL 例 4.15 2:1 复 用 器 的 结构 建 模 


SystemVerilog 


module mux2(input logic [3:0] d0, dl, 
input logic Ss, 
output tri [3:0] y}: 


tristate tO(d0, ~s, y); 
tristate tl(dl, s, y); 
endmodule 
在 SystemVerilog 中 ， 人 允许 如 ~ s 这 样 的 表达 
式 用 于 实例 的 端口 列表 中 。 随 意 复杂 的 表达 式 虽 
然 是 合法 的 ， 但 是 并 不 提倡 ， 因 为 这 会 降低 代码 
的 可 读 性 。 


VHDL 


library IEEE; use IEEE.STO_LOGIC_1164.a11; 


entity mux2 is 
port(d0, dl: in STD_LOGIC_VECTOR(3 downto 0); 
S: in STO_LOGIC; 
y: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 


architecture struct of mux2 is 
component tristate 
port(a: in STD_LOGIC_VECTOR(3 downto 0); 
en: in STD_LOGIC; 
y: out STO_LOGIC_VECTOR(3 downto 0)): 


end component: 
signal sbar: STD_LOGIC; 
begin 
sbar <= not S; 
tO: tristate port map(d0, sbar, y); 
tl: tristate port map(dl,s, y); 
end; 


在 VHDL 中 ， 不 允许 如 not s 这 样 的 表达 式 出 现在 实例 的 
端口 映射 中 。 因 此 ，sbar 应 该 定义 为 一 个 单独 的 信和 号。 





图 4-12 mux2 综合 后 的 电路 


HDL fij 4. 16 显示 了 一 个 模块 怎样 访问 部 分 总 线 。 一 个 8 位 宽 的 2:1 复 用 器 用 两 个 已 定义 
的 4 位 2:1 复 用 器 构建 ， 对 字 节 的 高 半 字 节 和 低 半 字 节 分 别 进行 操作 。 

一 般 来 说 ， 复 杂 系 统 都 是 分 层 定义 的 。 通 过 实例 化 主要 的 组 件 的 方式 来 结构 化 地 描述 整个 
系统 。 每 一 个 组 件 由 更 小 的 模块 结构 化 地 构成 ， 然 后 进一步 分 解 直到 组 件 足够 简单 可 以 描述 行 
为 。 避 免 ( 或 至 少 减少 ) 在 一 个 单独 模块 中 混合 使 用 结构 和 行为 描述 是 一 种 好 的 程序 设计 风格 。 


HDL $4.16 访问 部 分 总 线 


SystemVerilog VHDL 


module mux2_8(input logic [7:0] sy dl, 
input logic 
output logic [7:0] re 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux2_8 is 
port(d0, dl: in STD_LOGIC_VECTOR(7 downto 0); 


mux2 1sbmux(d0[3:0], d1[3:0], s, y[3:0]); S: in STD_LOGIC; 
mux2 msbmux(d0[7:4], d1[7:4], s, y[7:4]); y: out STD_LOGIC_VECTOR(7 downto 0)); 
endmodule end; 


architecture struct of mux2_8 is 
component mux2 
port(d0, dl: in STD_LOGIC_VECTOR(3 downto 0); 


硬件 描述 语 
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S: in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(3 downto 0)); 
end component; 


begin 


1sbmux: mux2 
port map(d0(3 downto 0), d1(3 downto 0), 
s. y(3 downto 0)); 
msbmux: mux2 
port map(d0(7 downto 4), d1(7 downto 4), 
s, y(7 downto 4)); 


end; 





图 4-13 mux2 8 综合 后 的 电路 


4.4 ”时 序 逻 辑 


HDL 综合 器 可 以 识别 某 种 风格 ， 然 后 把 它们 转换 成 特定 的 时 序 电路 。 其 他 的 编码 风格 可 以 
正确 地 模拟 ,但 把 出 现 明显 或 不 明显 的 错误 综合 到 电路 中 。 本 节 介 绍 寄存 器 和 锁 存 器 的 正确 描 
述 风格 。 


4.4.1 寄存 器 


大 多 数 现代 的 商业 系统 都 由 寄存 器 构成 的 ， 这 些 寄存 器 使 用 正 边 沿 触发 的 DD fh a. HDL 
例 4. 18 给 出 了 这 些 触发 器 的 风格 。 

在 SystemVerilog 的 always 语句 和 VHDL 的 process 语句 中 ， 信 和 号 保持 它们 原来 的 值 直 
到 敏感 信号 列表 中 的 一 个 事件 发 生 ， 该 事件 明显 地 引起 它们 改变 。 因 此 ， 具 有 合适 敏感 信号 列 
表 的 代码 ， 可 以 用 于 描述 有 记忆 能 力 的 时 序 电路 。 例 如 ， 触 发 器 在 敏感 信号 列表 中 只 有 clk. 
这 说 明 在 下 一 个 clk 的 上 升 沿 到 来 前 a 都 保持 原来 的 值 ， 即 使 a 在 中 途 发 生 改 变 。 

AAR, 在 右边 的 任何 一 个 输入 发 生 改 变 时 ，SystemVerilog 连续 赋值 语句 (assign) 和 
VHDL 并 发 赋值 语句 ( < = ) 就 会 重新 计算 值 。 因 此 ， 这 样 的 代码 用 于 描述 组 合 电 路 。 


4.4.2 复位 寄存 器 


当 模 拟 开始 或 者 电路 首次 通电 时 ， 和 触发 器 或 者 寄存 器 的 输出 是 未 知 的 。 在 SystemVerilog 和 
VHDL 中 分 别 用 x 和 Ta 表示。 一 般 来 说 ， 应 该 使 用 复位 寄存 器 ， 这 样 在 上 电 时 可 以 把 系统 置 于 
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已 知 状态 。 复 位 可 以 是 同步 的 也 可 以 是 异步 的 。 异 步 复 位 马上 就 生效 ， 而 同步 复位 只 能 在 时 钟 
的 下 一 个 上 沿 时 才能 清除 输出 。HDL fill 4. 19 说 明了 同步 复位 和 蜡 步 复 位 触发 器 的 风格 。 注 意 ， 
在 原理 图 中 难以 分 辨 同步 和 异步 复位 。 用 Synplify Premier 生成 的 原理 图 把 异步 复位 放 在 触发 如 
的 底部 ， 把 同步 复位 放 在 左边 。 


HDL 例 4.17 寄存 器 


SystemVerilog 


module flop(input logic clk, 
input logic [3:0] d, 
output logic [3:0] q); 


always_ff @(posedge clk) 
q <=d; 
endmodule 
一 般 来 说 ，SystemVerilog 的 always 语句 写成 如 下 
的 形式 : 


always @(sensitivity list) 
statement; 


只 有 当 sensitivity List( 人 敏感 信号 列表 ) 中 说 明 
的 事件 发 生 时 才 执 行 statement. FEIX TMF +H, iy 
是 q< =d( 读 作 “ag 得 到 d”)。 因 此 ， 触 发 器 在 时 钟 的 
正 边沿 把 d 复制 到 q， 否 则 就 保持 gq 的 原来 状态 。 注 意 ， 
敏感 信号 列表 也 可 指 激励 信号 列表 。 

< = 称 为 非 阻 塞 赋值 。 这 时 可 以 把 它 看 作 一 个 普通 
的 等 号 ”= "。 将 在 4.5.4 节 中 继续 讨论 更 多 的 细节 。 注 
意 , E always 语句 中 ，< = 代替 了 assign. 

在 随后 的 各 节 中 将 看 到 ，always 语句 可 以 用 来 表示 
触发 器 、 锁 存 器 或 组 合 逻 辑 ， 取 决 于 敏感 信号 列表 和 热 
行 语 句 。 正 因为 这 样 的 灵活 性 ， 所 以 容易 在 不 经 意 间 制 
造 出 错误 的 硬件 电路 。SystemVerilog 引信 always ff, 
always latch 和 always comb 来 降低 产生 这 些 常 见 
错误 的 风险 。always_ff 的 行为 与 always 一样， 但 只 
用 来 表示 触发 器 ， 并 且 如 果 它 用 于 表示 其 他 器 件 时 人 允许 
工具 生成 警告 信息 。 


a > 
0 = 


D[3:0] 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity flop is 
port(clk: in STD_LOGIC; 
d: in STD_LOGIC_VECTOR(3 downto 0); 
q: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 
architecture synth of flop is 
begin 
process(clk) begin 
if rising_edge(clk) then 
q <= d; 
end if; 
end process; 
end; 


VHDL 的 process 语句 写成 如 下 的 形式 : 


process(sensitivity list) begin 
statement; 
end process; 


只 有 当 sensitivity 1ist( 人 敏感 信号 列表 ) 中 的 
变量 改变 时 才 执 行 statement。 在 这 个 例子 中 ，if 语 
句 检 查 是 否 在 clk 的 上 升 沿 发 生 改 变 。 如 果 是 ， 则 g < 
=d( 读 作 “q 得 到 d”) 。 因 此 ， 触 发 器 在 时 钟 的 正 边沿 
把 a 复制 到 q， 否 则 就 记录 q 的 原来 状态 。 

触发 器 的 另 一 种 VHDL 风格 是 : 


process(clk) begin 
if clk*'event and clk='1" then 
q <=d; 
end if; 
end process; 


这 里 rising edge (clk) ll F clk'event 和 
clk=1, 


[3:0] 


30 Z> 


Q[3:0] 


4-14 flop 综合 后 的 电路 


4.4.3 市 使 能 端的 寄存 器 


只 有 在 使 能 有 效 时 带 使 能 端的 寄存 器 才 响 应 时 钟 。HDL 例 4. 19 显示 了 一 个 异步 复位 使 能 
寄存 器 。 如 果 reset 和 en 都 是 FALSE 时 ， 则 它 保持 原来 的 值 。 


4.4.4 多 寄存 器 


一 条 单独 的 always/process 语句 可 以 用 于 描述 多 个 硬件 。 例 如 ，3.5.5 节 的 同步 器 由 
两 个 背靠背 连接 的 触发 器 组 成 ， 如 图 4-17 所 示 。HDL 例 4. 20 描述 了 同步 器 。 在 clk 的 上 升 


沿 ， d 复制 到 nl. 同时 , nl 复制 到 Jo 


硬件 描述 语 
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HDL $4.18 可 复位 寄存 器 
SystemVerilog VHDL 
module flopr(input logic clk, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
input logic reset, ; i 
; ; entity flopr is 
Se a tote Cauda port(clk, reset: in STD_LOGIC: 
pan ray ey See d: in STD_LOGIC_VECTOR(3 downto 0); 
// asynchronous reset q: out STD_LOGIC_VECTOR(3 downto 0)); 
always_ff @(posedge clk, posedge reset) end; 
if (reset) q S=4"b0; architecture asynchronous of flopr is 
else q <=d; i 
endmodule bein 
process(clk, reset) begin 
module flopr(input logic clk, if reset then 
input logic reset, q <= "0000"; 
input logic [3:0] d, elsif rising_edge(clk) then 
output logic [3:0] q); q <=; 
// synchronous reset end if; 
always_ff @(posedge clk) end process; 
if (reset) q <=4'bO; end; 
else q <= d; , 
ananadil é library IEEE; use IEEE.STD_LOGIC_1164.a11; 
在 always 语句 敏感 信号 列表 中 的 多 个 信号 用 逗号 可 
或 者 or SH. TERM, posgdge reset 在 异步 复位 触发 d: in STD_LOGIC_VECTOR(3 downto 0); 
器 的 敏感 信号 列表 中 ， 但 不 在 同步 复位 触发 器 中 。 因 此 ， q: out STD_LOGIC_VECTOR(3 downto 0)); 


异步 复位 触发 器 会 马上 响应 reset 的 上 升 沿 。 但 是 ， 同 
步 复位 触发 器 只 在 时 钟 的 上 沿 时 响应 reset. 

因为 两 个 模块 的 名 字 都 是 flopr， 所 以 只 能 在 设计 
中 使 用 其 中 一 个 。 


end; 


architecture synchronous of flopr is 
begin 
process(clk) begin 
if rising_edge(clk) then 
if reset then q <= "0000"; 
else q <=d; 
end if; 
end if; 
end process; 
end; 


在 process 语句 敏感 信号 列表 中 的 多 个 信号 用 到 
号 分 隔 。 注 意 ，reset 在 异步 复位 触发 器 的 敏感 信号 列 
表 中 ， 但 不 在 同步 复位 触发 器 中 。 因 此 ， 异 步 复位 触发 
器 会 马上 响应 reset 的 上 升 沿 。 但 是 同步 复位 触发 器 
只 在 时 钟 的 上 升 沿 时 响应 reset。 

触发 器 的 状态 在 VHDL 模拟 期 间 在 启动 时 被 初始 化 
avs 

如 之 前 提 及 的 ，architecture 的 名 字 ( 此 例 中 的 
asynchronous 或 者 synchronous ) 会 被 VHDL 工具 
忽略 但 是 对 人 们 阅读 代码 有 帮助 。 因 为 两 个 archi- 


”tecture 都 描述 了 实体 flopr， 所 以 在 设计 中 只 能 使 


用 其 中 一 个 。 





b ) 同步 复位 
K| 4-15 flopr 综合 后 的 电路 
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HDL $4.19 复位 使 能 寄存 器 
SystemVerilog VHDL 
module flopenr(input logic clk; library IEEE; use IEEE.STD_LOGIC_1164.al1; 
input logic reset, 
input Togic sn, entity flopenr is 
input logic [3:0] d portictk, 
5 reset, 


output logic [3:0] q); 


// asynchronous reset 
always_ff @(posedge clk, posedge reset) 


if (reset) q <=4'b0; 
else if (en) q <=d; 
endmodule 


en: in STD_LOGIC; 

d: in STD_LOGIC_VECTOR(3 downto 0); 

q: out STD_LOGIC_VECTOR(3 downto 0)); 
end; 


architecture asynchronous of flopenr is 
-- asynchronous reset 
begin 
process(clk, reset) begin 
if reset then 
q <= "0000": 
elsif rising_edge(clk) then 
if en then 
q <=d; 
end if; 
end if; 
end process; 
end; 





CLK 


图 4-17 


CLK 


同步 锅 电 路 


HDL 例 4.20 同步 器 


SystemVerilog 


module sync(input logic clk, 
input logic d, 
output logic q); 


logic nl; 


always_ff @(posedge clk) 
begin 
nl <=d; // nonblocking 
q <=nl; // nonblocking 
end 
endmodule 


注意 ，begin/end 结构 是 必要 的 ， 因 为 有 多 条 声明 
语句 出 现在 always 语句 中 。 这 与 C 或 java 中 的 { } 相 
似 。begin/end 在 flopr 例子 中 并 不 是 必须 的 ， 因 为 
if/else 是 一 条 单独 的 语句 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity sync is 
port(clk: in STD_LOGIC; 
d: in STD_LOGIC; 
q: out STD_LOGIC); 
end; 


architecture good of sync is 
signal nl: STD_LOGIC; 
begin 
process(clk) begin 
if rising_edge(clk) then 
nl <=d; 
q <=nl1; 
end if; 
end process; 
end; 


nl 必须 声明 为 signal， 因 为 它 是 模块 内 使 用 的 内 
部 信号 。 
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4.4.5 锁 存 器 


在 3.2.2 节 中 ， 当 时 钟 为 HIGH 时 , D 锁 存 器 是 透明 的 ， 人 允许 数据 从 输入 流向 输出 。 当 时 
SHAY LOW 时 锁 存 器 变 为 不 透明 的 ， 保 持原 来 的 状态 。HDL 例 4. 21 显示 了 D 锁 存 器 的 风格 。 

不 是 所 有 的 综合 工具 都 能 很 好 地 支持 锁 存 器 。 除 非 你 知道 工具 支持 锁 存 器 ， 或 者 你 有 理由 
使 用 它们 ， 和 否则 ， 最 好 不 使 用 它们 而 使 用 边沿 触发 器 。 还 要 注意 HDL 代码 不 能 表示 任何 意外 
的 锁 存 器 ， 如 果 不 注意 ， 就 会 发 生意 想不到 的 事 。 当 创建 锁 存 器 时 很 多 综合 工具 会 发 出 警告 。 
如 果 你 不 希望 它 存 在 ， 就 在 HDL 中 寻找 这 个 漏洞 。 如 果 你 不 知道 你 是 否 要 生成 锁 存 器 ， 那 么 
你 很 可 能 将 HDL 作为 一 门 编程 语言 来 处 理 ， 这 将 给 你 带 来 更 大 的 潜伏 问题 。 


HDL j 4.21 D 锁 存 器 


SystemVerilog VHDL 

module latch(input logic clk, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
pr Mc LM entity atch 

P e a port(clk: in STD_LOGIC; 
always_latch d: in STD_LOGIC_VECTOR(3 downto 0); 
if (clk) q <= d; q: out STD_LOGIC_VECTOR(3 downto 0)); 
endmodule end; = 
always_latch 等 同 于 always@ (clk, architecture synth of latch is 


qd), te System Verilog 中 用 来 描述 锁 存 器 的 首选 d) begin 
风格 。 它 评估 任何 时 间 clk 和 a 的 变化 。 如 果 if clk='1' then 
clk 为 HIGH， 则 a 的 值 传 递 给 gs， 因此 这 段 代 ot 


码 描述 了 一 个 正 级 敏感 锁 存 器 。 否则 ， g RIFE end process; 
原来 的 值 。 如 果 always latch 模块 不 表示 锁 end; 


存 器 ， 则 SystemVerilog 将 生成 相应 的 警告 。 敏感 信号 列表 包括 clk Ad, IMA process 评估 任何 时 间 
clk Ald 的 改变 。 如 果 clk 为 HIGH， 那 么 d 的 值 就 传递 给 qo 





4-19 latch 综合 后 的 电路 


4.5 更 多 组 合 逻 辑 


在 4.2 节 中 ， 使 用 赋值 语句 从 行为 上 描述 组 合 逻 辑 。SystemVerilog 的 always 语句 和 
VHDL 的 process 语句 可 以 用 于 描述 时 序 电 路 ， 因 为 当 没 有 产生 新 的 状态 时 ， 它 们 将 保持 原 
来 的 状态 。 然 而 ，always/process 语句 也 可 以 用 于 描述 组 合 逻 辑 的 行为 ， 如 果 人 敏感 信号 列 
表 包 含 对 所 有 输入 的 响应 ， 正文 描 述 每 一 种 可 能 输入 组 合 的 输出 值 。HDL 例 4. 22 使 用 al- 
ways/process 语句 描述 了 4 个 一 组 的 反 相 器 ( 见 图 4-3 的 综合 后 的 电路 ) 。 
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HDL j 4.22 使 用 always/process 语句 的 反 相 器 


SystemVerilog 


module inv(input logic [3:0] a. 
output logic [3:0] y); 


always_comb 
y=~a; 

endmodule 

x always 语句 中 的 < = 或 = 右边 的 信号 发 生 改 变 
it, always comb 就 重新 运算 always 声明 语句 中 的 代 
码 。 在 这 种 情况 下 ，always comb 等 同 于 always @ 
(a), BEHE always @ (a) 更 好 ， 因 为 它 避 免 了 在 al- 
ways 语句 中 由 于 信号 改名 或 添加 信号 所 带 来 的 错误 。 如 
R always 模块 中 的 代码 不 是 组 合 逻 辑 ， 则 SystemVerilog 
将 产生 警告 信息 。Always comb 等 同 于 always @ 
(* ) ， 但 它 在 SystemVerilog 中 更 常用 。 

= 在 always 语句 中 称 为 阻塞 赋值 (blocking assign- 
ment) ， 与 之 相对 的 < = 称 为 非 阻塞 赋值 ( non-blocking as- 
signmeng) 。 在 SystemVerilog 中 ， 在 组 合 逻 辑 中 适合 使 用 
阻塞 赋值 ， 而 在 时 序 逻 辑 中 需要 使 用 非 阻 塞 式 赋值 。 这 
将 在 4.5.4 节 中 进一步 讨论 。 


HDL 支持 在 always/process 语句 中 的 阻塞 和 非 阻塞 赋值 。 
代码 中 出 现 的 顺序 来 计算 ， 与 一 些 标准 的 编程 语言 一 样 。 


在 左边 的 信号 更 新 前 ， 计 算 所 有 的 语句 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.all; 


entity inv is 
port(a: in STD_LOGIC_VECTOR(3 downto 0); 
y: out STD_LOGIC_VECTOR(3 downto 0)): 
end; 


architecture proc of inv is 
begin 
process(all) begin 
y <=not a; 
end process; 
end; 

当 process 语句 中 的 信和 号 发 生 改 变 时 ， process 
(all) 就 重新 运算 在 process 语句 中 的 代码 。 
Process (all) 等 同 于 process (a), BÈ 
process (a) 更 好 ， 因 为 它 避 免 了 process 语句 中 由 
于 信号 改名 或 添加 信和 号 所 带 来 的 错误 。 

Æ VHDL F, begin 和 end process 语句 都 是 需 
要 的 ， 尽管 brocess 只 有 一 条 赋值 语句 。 


一 组 阻塞 赋值 语句 将 以 其 在 
一 组 非 阻塞 赋值 语句 则 并 行 地 计算 。 


HDL ffi] 4. 23 定义 了 一 个 全 加 器 ， 该 全 加 器 使 用 中 间 信 号 pb 和 aq 来 计算 s 和 cout。 它 产 
生 的 电路 与 图 4-8 一 样 ， 但 在 赋值 语句 中 使 用 了 always/process 语句 。 

这 两 个 例子 是 使 用 always/process 语句 对 组 合 逻辑 建 模 的 不 好 例子 ， 因 为 它们 比 HDL 
例 4.2 和 HDL 例 4.7 使 用 赋值 语句 实现 相等 功能 需要 更 多 的 代码 。 然 而 ， 对 更 复杂 的 组 合 电路 


E case 和 if 语句 更 方便 。case 和 if 语句 必须 出 现在 always/process 语句 中 ， 我们 
将 在 下 一 小 节 中 继续 讨论 。 
SystemVerilog VHDL 
在 SystemVerilog 的 always 语句 中 ，= 表示 阻塞 赋 在 VHDL 的 process 语句 中 ,: = 表示 阻塞 赋值 ， 
值 ，< = 表示 非 阻 塞 赋值 (也 被 称 为 并 发 赋值 ) 。 < = 表示 非 阻 塞 赋值 (也 被 称 为 并 发 赋值 ) 。 这 里 是 第 一 
不 要 把 使 用 assign 语句 的 连续 赋值 与 这 两 语句 混 次 介绍 : = 的 章节 。 
Ño assign 语句 必须 放 在 always 语句 的 外 面 ， 而 且 是 非 阻 塞 赋值 用 于 产生 输出 和 信号。 阻塞 赋值 用 于 产 
并 发 计算 。 生 process 语句 中 声明 的 变量 ( 见 HDL 例 4.23)。< = 
也 可 以 出 现在 process 的 外 面 ， 这 里 它 也 是 并 发 计算 。 
4.5.1 case 语句 


使 用 always/process 语句 实现 组 合 逻 辑 的 一 个 较 好 应 用 是 利用 case 语句 实现 七 段 显 
ANE at. case 语句 必须 出 现在 always/process 语句 的 内 部 。 

你 可 能 已 经 注意 到 ， 在 例 2. 10 的 七 段 显 示 译 码 器 中 ， 大 模块 组 合 逻 辑 的 设计 过 程 完 长 乏 
味 且 容易 出 错 。HDL 做 了 巨大 的 改进 ， 它 允许 用 户 在 更 高 的 抽象 层 说 明 功 能 ， 然 后 自动 把 功能 
综合 到 门 电路 中 。 基 于 真 值 表 ，HDL 例 4. 24， 使 用 case 语句 描述 七 段 显示 译 码 器 。case if 
名 基于 输入 值 执行 不 同 的 动作 。 如 果 所 有 可 能 的 输入 组 合 都 被 定义 ， 则 case 语句 就 表示 组 合 
逻辑 ; 否则 ， 它 就 表示 时 序 逻 辑 ， 因 为 输出 会 保持 为 未 定义 情况 下 的 原来 值 。 
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HDL 例 4. 23 使 用 always/process 语句 的 全 加 器 


SystemVeilog 


module fulladder(input logica, b, cin, 
output logics, cout); 
logic p, 9; 


always_comb 
begin 

p=a’b; 

g=a4&b; 


sap ^ cin; 
cout=g | (p& cin); 
end 
endmodule 


// blocking 
// blocking 


// blocking 
// blocking 


AP, always @ (a,b,cin) 与 al- 
ways comb 等 价 。 不 过 ， always comb 更 好 ， 
因为 它 避 免 了 在 敏感 信号 列表 中 漏 写 信号 的 常见 
错误 。 

基于 4. 5.4 节 讨 论 的 原因 ， 最 好 使 用 阻塞 赋 
值 实现 组 合 逻 辑 。 本 例 首先 计算 P， 然 后 计算 g， 
然后 计算 s， 最 后 计算 cout。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity fulladder is 
port(a, b, cin: in STD_LOGIC; 
s, cout: out STD_LOGIC); 
end; 
architecture synth of fulladder is 
begin 
process(al]) 
variable p, g: STD_LOGIC; 
begin 
p :=a xor b; -- blocking 
g :=a and b; ~- blocking 
s <= p xor cin; 
cout <= g or (pand cin); 
end process; 
end; 


AIHA, process @ (a,b,cin) j process (all) 等 价 。 
Ait, process (all) 更 好 ， 因 为 它 避 免 了 在 敏感 信号 列表 中 
漏 写 信号 的 常见 错误 。 

基于 4. 5.4 节 讨 论 的 原因 ， 最 好 使 用 阻塞 赋值 来 计算 组 合 
逻辑 中 的 中 间 变 量 。 这 个 例子 中 对 P 和 g 使 用 阻塞 赋值 ， 这 样 
在 计算 依赖 于 它们 值 的 s 和 cout 前 首先 计算 它们 。 

因为 p 和 9 出 现在 process 语句 中 的 阻塞 赋值 := 的 左 侧 ， 
所 以 它们 必须 声明 为 variable 而 不 是 signal。 变 量 声 明 出 
现在 使 用 它 的 过 程 的 begin 之 前 。 


HDL 例 4.24 七 段 管 显示 译 码 器 


SystemVerilog 


module sevenseg(input logic [3:0] data, 
output logic [6:0] segments); 
always_comb 
case(data) 
// abc_defg 


0: segments =7'b111_1110; 
1: segments =7'b011_0000; 
2: segments =7'b110_1101; 
3: segments =7'b111_1001; 
4: segments =7'b011_0011; 
5; segments =7'b101_1011; 
6: segments =7'b101_1111; 
7: segments =7'b111_0000; 
8: segments=7'bl11_1111; 
9: segments =7'bl11_0011; 
default: segments =7'b000_0000; 
endcase 
endmodule 


case 语句 检查 data MA. 4 data HO 
时 ， 语 句 执 行 冒号 后 的 动作 ,设置 segments 为 
1111110。 类 似 地 ，case 语句 检查 其 他 data 值 ， 
最 高 是 9 (这 里 使 用 了 默认 的 基 ，10)。 

Default 子 句 是 一 种 非常 方便 的 方法 ， 用 于 
定义 没有 明确 列 出 的 所 有 情况 下 的 输出 ， 这 样 可 
以 保证 产生 组 合 逻 辑 。 

在 SystemVerilog 中 ，case 语句 必须 出 现在 
always 语句 内 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.al1; 


entity seven_seg_decoder is 
port(data: in STD_LOGIC_VECTOR(3 downto 0); 
segments: out STD_LOGIC_VECTOR(6 downto 0)); 
end; 


architecture synth of seven_seg_decoder is 
begin 
process(all) begin 
case data is 


-- abcdefg 
when X"0" => segments <= "1111110"; 
when X"1" => segments <= "0110000"; 


when X"2" => segments <= "1101101"; 
when X"3"=> segments <= "1111001"; 


when X"4" => segments <= *0110011"; 
when X"5" => segments <= "1011011"; 
when X"6" => segments <= "1011111"; 
when X"7" => segments <= "1110000"; 


when X"8" => segments <= "1111111"; 


when X"9" => segménts <= "1110011"; 
when others => segments <= "0000000"; 
end case; 
end process; 


end; 


case 语句 检查 data 的 值 。 当 data 为 0 时 ,语句 执行 
= > 后 的 动作 ， 设 置 segments 为 1111110。case 语句 检查 其 
他 data 值 ， 最 高 是 9( 注意 x 表示 十 六 进 制 数 ) Others 子 句 
可 以 方便 地 定义 没有 明确 列 出 的 所 有 情况 下 的 输出 ， 这 样 可 以 
保证 电路 为 组 合 逻辑 。 

与 SystemVerilog 不 同 ，VHDL 支持 选择 信号 赋值 语句 (参见 
HDL 例 4.6)。 它 与 case 语句 很 相似 , 但 它 可 以 出 现在 进程 
(process) 的 外 面 。 因 此 ， 没 有 原因 使 用 进程 来 描述 组 合 逻辑 。 
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Al 4-20 sevenseg 综合 后 的 电路 


Synplify Premier 把 七 段 显 示 译 码 器 综合 为 一 个 针对 16 种 不 同 输入 而 产生 7 位 输出 的 只 读 存 
储 器 (ROM) 。ROM 将 在 5.5.6 节 进 一 步 讨 论 。 

如 果 case 语句 中 漏 写 了 default MF other 子 句 ， 那 么 译 码 器 将 在 输入 数据 为 10 ~ 15 
时 ， 记 录 它 先前 的 输出 。 对 于 硬件 来 说 这 是 一 个 奇怪 的 行为 。 

普通 的 译 人 码 器 一 般 也 使 用 case 语句 。HDL 例 4. 25 描述 了 一 个 3:8 译 码 器 。 


4.5.2 if 语句 


always/process 语句 中 可 以 包含 if 语句 。If 语句 的 后 面 还 可 以 出 现 else 语句 。 如 
果 所 有 可 能 的 输入 组 合 都 处 理 了 ， 则 这 条 语句 就 表示 组 合 逻 辑 ; 和 否则， 就 产生 时 序 逻 辑 ( 类 似 
于 4.4.5 节 的 锁 存 器 ) o 

HDL 例 4. 26 使 用 if 语句 描述 2.4 节 中 定义 的 优先 级 电路 。N 输入 优先 电路 将 对 应 的 最 高 
有 效 输入 为 TRUE 的 位 设置 为 输出 TRUE. 


4.5.3 ”和 带 有 无 关 项 的 真 值 表 


正如 在 2.7.3 节 中 讨论 的 ， 真 值 表 中 可 能 包含 无 关 项 从 而 提供 更 多 逻辑 简化 可 能 。HDL 例 4.27 
展示 了 如 何 用 无 关 项 描述 优先 级 电路 。 

Synplify Premier 为 这 个 模块 综合 了 电路 ， 它 与 图 4-22 的 优先 级 电路 稍微 有 些 不 同 ， 如 图 4-23 
所 示 。 然 而 ， 它 们 是 逻辑 等 价 的 。 


HDL 例 4.25 3:8 Ms 


SystemVerilog VHDL 


module decoder3_8(input logic [2:0] a, library IEEE; use IEEE.STD_LOGIC_1164.a11; 


output logte £720) y); entity decoder3_8 is 


always_comb port(a: in STD_LOGIC_VECTOR(2 downto 0); 


ered ea © Y: Out STD_LOGIC-VECTOR(7 downto 0)); 
3'b001: y=8'b00000010; end; 
3'b010: y=8'b00000100; architecture synth of decoder3_8 is 
3'b011: y=8'b00001000; begin 
3'b100: y=8'b00010000; process(al1) begin 
3'b101: y=8'b00100000; case a is 
3'b110: y=8'b01000000; when "000" => y <= "00000001"; 
3'bll1: y=8'b10000000; when "001" => y <= "00000010"; 
default: y=8'DXXXXXxxx; when “010" => y <= "00000100"; 
endcase when "011" => y <= "00001000"; 
endmodule when "100" => y <= "00010000"; 
5 when "101" => y <= "00100000"; 
对 于 本 例 中 的 逻辑 综合 来 说 ，default 语句 不 是 严 when "110" => y <= "01000000"; 
格 必需 的 ， 因 为 定义 了 所 有 可 能 的 输入 组 合 ， 但 是 在 模 phe is a Botorik 
when others => y <=" igt- 
拟 中 需要 考虑 周全 ， 以 防 万 一 出 现 某 个 输入 为 x zo ed caves M, 
end process; 


end; 


对 于 本 例 中 的 逻辑 综合 来 说 ，others FAIRE 
严格 必需 的 ， 因 为 定义 了 所 有 可 能 的 输入 组 合 ; 但 是 
在 仿真 中 需要 考虑 周全 ， 以 防 万 一 出 现 某 个 输入 为 x 
或 z。 
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4-21 decoder3 8 综合 后 的 电路 


HDL 例 4. 26 优先 级 电路 


SystemVerilog VHDL 
module priorityckt(input logic [3:0] a, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
output logic [3:0] y); entity priorityckt is 
always_comb port(a: in STD_LOGIC_VECTOR(3 downto 0); 
if (a[3]) y<=4'b1000; y: out STD_LOGIC_VECTOR(3 downto 0)); 
else if (a[2]) y<=4'b0100; end; 
else if (af1]) y<=4‘b0010; architecture synth of priorityckt is 
else if (a[0]) y<=4"b0001; begin 
else y <=4'b0000; process(all]) begin 
endmodule if a(3) then y <= "1000"; 
. i à Š elsif a(2) then y <= "0100"; 
在 SystemVerilog H, if 语句 必须 出 现在 always 语 elsif a(1) then y <= "0010": 


人 名 内 。 elsif a(0) then y <= "0001"; 


124 第 4 章 


else y <= "0000"; 
end if; 
end process; 
end; 


与 SystemVerilog Ae], VHDL 支持 条 件 信 号 赋值 语 
句 (参见 HDL 例 4.6)， 它 与 if 语句 很 相似 ， 但 是 它 出 
现在 进程 (process) 的 外 面 。 因 此 ， 没 有 原因 使 用 进程 摘 
述 组 合 逻 辑 。 


y_1[0] 
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4.5.4 ”阻塞 赋值 和 非 阻塞 赋值 


下 面 将 解释 什么 时 候 和 怎样 使 用 不 同 赋值 类 型 的 准则 。 如 果 不 遵照 这 些 准 则 引 ， 编 写 的 代 
码 就 可 能 在 模拟 时 正确 ， 但 综合 到 不 正确 的 硬件 。 本 节 的 余下 部 分 解释 这 些 准 则 的 原理 。 


HDL 例 4. 27 使 用 无 关 项 的 优先 级 电路 


SystemVerilog VHDL 


module priority_casez(input logic [3:0] a, library IEEE; use IEEE.STD_LOGIC_1164.a11; 


output logic [3:0] y); entity priority_casez is 


port(a: in STD_LOGIC_VECTOR(3 downto 0); 
y: out STD_LOGIC_VECTOR(3 downto 0)); 


always_comb 
casez(a) 
4'b1???: y<=4'b1000; 


4'b012?: y <=4"b0100; end; 
4'b001?: y <=4'b0010; architecture dontcare of priority_casez is 
4'b0001: y <=4'b0001; begin 
default: y<=4'b0000; process(all) begin 
endcase case? a is 
endmodule when "1---" => y <= "1000"; 
z when "01--" => y <= "0100"; 
casez 语句 的 作用 与 case 语句 一 样 ， 但 它 能 识别 when "001-" => y <= "0010"; 
D when "0001"=> y <= "0001"; 
作为 无 关 项 的 ?。 when others=> y <= "0000"; 
end case?; 
end process; 
end; 


case? 语句 的 作用 与 case 语句 一 样 ， 但 它 能 识 
别 作 为 无 关 项 的 -。 
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阻塞 和 非 阻 塞 赋值 准则 


SystemVerilog 
1) 使 用 always ff@ (posedge clk) 和 非 阻 
塞 赋值 描述 同步 时 序 逻 辑 。 


always_ff @(posedge clk) 
begin 
nl <= d; // 非 阻塞 
q <= nl; // 非 阻 塞 
end 


2) 使 用 连续 赋值 描述 简单 组 合 逻 辑 。 


assign y=s ? dl : d0; 


3) 使 用 always_comb 和 阻塞 赋值 描述 复杂 组 
合 逻 辑 将 很 有 帮助 。 


always_comb 
begin 
p=a ^b; // M8 
g=a å b; // 非 阻塞 
s=p^ cin; 
cout=g | (på cin); 
end 


4) 不 要 在 多 于 1 个 always 语句 或 者 连续 赋值 
语句 中 对 同一 个 信号 赋值 。 


1. ABS 


VHDL 


1 ) 使 用 process (clk) 和 非 阻 塞 赋值 描述 同步 时 序 
逻辑 。 


process(clk) begin 
if rising_edge(clk) then 
nl <= d; -- 非 阻塞 
q<=nl; -- 非 阻 塞 
end if; 
end process; 


2) FA process 语句 外 的 并 发 赋值 描述 简单 组 合 逻 辑 。 


y <=d0 when s='O' else dl; 


3) FA process (all) 描述 复杂 组 合 逻 辑 将 会 有 帮助 。 
使 用 阻塞 赋值 对 内 部 变量 进行 赋值 。 


process(all) 

variable p, g: STD_LOGIC; 
begin 

p:=axorb; -- 阻塞 

g:=aandb; -- 阻塞 

S <== p xor cin; 

cout <= g or (p and cin); 
end process; 


4) 不 要 在 多 于 1 个 process 语句 或 者 并 发 赋值 语句 中 对 
同一 个 信号 赋值 。 


使 用 阻塞 赋值 可 以 正确 对 HDL 例 4. 23 中 的 全 加 器 建 模 。 本 节 将 探讨 它 如 何 操作 以 及 如 果 


使 用 非 阻塞 赋值 则 有 什么 不 同 。 


Bita. b, cin 都 初始 化 为 0。 因 此 ，p、g、s 和 cout 也 是 0。 在 某 一 时 刻 ，a 改变 为 
1， 触 发 always/process 语句 。4 个 阻塞 赋值 按 顺 序 计算 (在 VHDL 代码 中 ，s 和 cout 并 发 
赋值 )。 注 意 因 为 p A g 是 阻塞 赋值 ， 所 以 它们 在 计算 s 和 cout 前 得 到 新 值 。 这 很 重要 ， 因 
为 我 们 希望 使 用 bp 和 g 的 新 值 来 计算 s 和 cout. 


1) p—1®0=1 
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2) gl -0=0 
3) se 1@0=1 


4) cout<+0+1-0=0 


RAF 


ABZ, HDL Hij 4.28 说 明了 非 阻塞 赋值 的 使 用 。 
HDL $i) 4. 28 ”使 用 非 阻 塞 赋值 的 全 加 器 


SystemVerilog 


// nonblocking assignments (not recommended) 
module fulladder(input logic a, b, cin, 
output logic s, cout); 
logic p. g; 


always_comb 

begin 
p <=a ^ b; // nonblocking 
g <= a å b; // nonblocking 
s <= p^ cin; 
cout <= g | (p&cin); 

end 

endmodule 


VHDL 


-- nonblocking assignments (not recommended) 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity fulladder is 
port(a, b, cin: in STD_LOGIC;: 
s, cout: out STD_LOGIC); 
end; 


architecture nonblocking of fulladder is 
signal p, g: STD_LOGIC; 
begin 
process(all) begin 
p <= a xor b; -- nonblocking 
g <= a and b; -- nonblocking 
s <= p xor cin; 
cout <= g or (pand cin); 
end process; 
end; 


因为 在 process 语句 中 p Al g 出 现 非 阻塞 赋值 的 
左边 ， 所 以 它们 必须 声明 为 signal 而 不 是 varia- 
ble。Signal 声明 出 现在 architecture 中 的 begin 


之 前 ， 而 不 是 process 中 。 


现在 考虑 a 从 0 上升 为 1， 而 b 和 cin 都 为 0 的 情况 。4 个 非 阻塞 赋值 并 发 地 计算 。 


PI@MO=1 g+1+0=0 


st-0 中 0=0 cout<0+0-0=0 
注意 s 与 p 并 发 计算 ， 因 此 使 用 p 的 原来 值 ， 而 不 是 新 值 。 所 以 ，s 保持 0 而 不 是 1。 然 


而 ，P 从 0 改变 为 1。 这 个 改变 触发 always/process 语句 ， 进 行 第 二 次 计算 ， 过 程 如 下 : 


p-l®1=1 g+1-0=0 


cout+0 +1 -0=0 
这 次 ，P 已 经 是 1， 所 以 s 正确 地 改变 为 1。 非 阻塞 赋值 最 后 达到 正确 值 ， 但 是 always/ 


process 语句 必须 计算 两 次 。 这 使 仿真 变 慢 ， 尺 管 它 综合 出 来 同样 的 硬件 。 


在 对 组 合 逻 辑 建 模 时 ， 使 用 非 阻 塞 赋值 的 另 一 个 缺点 是 ， 如 果 你 忘记 把 中 间 变 量 包括 在 敏 
感 信号 列表 中 ,那么 HDL 会 产生 错误 的 结果 。 


SystemVerilog 


如 果 HDL fi 4.28 中 always 语句 的 敏感 信号 列表 写 
作 always @ (a,b,cin), Mf always_comb, Jf 
么 这 条 语句 就 不 会 在 p 或 g 改变 时 重新 计算 。 在 这 种 情 


况 下 ，s 会 错误 保持 为 0， 而 不 是 1。 


更 糟 的 是 ， 即 使 错误 的 敏感 信号 列表 引起 了 模拟 错误 ,一 些 综合 工具 也 会 综合 得 到 正确 的 
鲁 件 。 这 就 导致 模拟 结果 和 人 硬件 实际 操作 不 匹配 。 


2. HFE 


使 用 非 阻塞 式 赋值 可 以 正确 地 描述 HDL 例 4. 20 同步 器 中 的 。 在 时 钟 的 上 升 沿 ，d 复制 到 
nl ， 同 时 nl 复制 到 q， 所 以 代码 准确 地 描述 了 两 个 寄存 器 。 例 如 ， 假 设 初 始 化 d=0，,， ni =1, 


VHDL 


如 果 HDL fij 4.28 中 process 语句 的 敏感 信号 列 
RHE process (a, b, cin), MA Æ process 
(all) ， 那 么 这 条 语句 不 会 在 p 或 g 改变 时 重新 计算 。 


在 这 种 情况 下 ，s 会 错误 地 保持 为 0， 而 不 是 1。 


gq=0。 在 时 钟 的 上 升 党 ， 下 面 两 个 赋值 将 并 发 发 生 ， 所 以 时 钟 沿 后 ，nl =0，q =1。 


nl<«d =0 qe—nil =1 


HDL fij 4. 29 尝试 用 阻塞 赋值 来 描述 同一 个 模块 。 在 clk WEE, d 复制 到 n1。 之 后 nl 
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的 这 个 新 值 复制 到 q， 导 致 nl 和 q 中 出 现 不 正确 的 4d。 在 时 钟 沿 后 赋值 依次 进行 ，q =n1 =0。 


1) nil*—d=0 
2) q+—nl =0 
HDL $i) 4.29 使 用 阻塞 赋值 的 不 好 的 同步 器 
SystemVeilog VHDL 
// Bad implementation of a synchronizer using blocking -- Bad implementation of a synchronizer using blocking 
// assignments -- assignment 


module syncbad(input logic clk, 


input logicd, entity syncbad is 
output logic q); port(clk: in STD_LOGIC; 


logic nl; q: out STD_LOGIC); 
always_ff @( posedge clk) end; 
begin | 
nl=d; // blocking architecture bad of syncbad is 
q=nl; // blocking begin 
end process(clk) 
endmodule variable nl: STD_LOGIC; 
begin 


if rising_edge(clk) then 


end 
end; 


clk 一 > 
foo 


q 


d: in STD_LOGIC; 


nl :=d; -- blocking 


process; 


‘> 
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library IEEE; use IEEE.STD_LOGIC_1164.a11; 


因为 nl 对 外 界 是 透明 的 ， 对 q 的 行为 没有 影响 ， 所 以 同步 器 完全 把 它 优化 掉 了 ， 如 


图 4-24 所 示 。 


在 对 时 序 逻 辑 建 模 时 ， 在 always/process 语句 中 必须 使 用 非 阻塞 赋值 。 如 果 你 足够 聪 


明 ， 如 反 转 赋值 语句 的 顺序 ， 可 以 使 阻塞 赋值 正确 地 执行 ， 


但 是 阻塞 赋值 并 没有 优势 ， 反 而 带 


来 了 未 知行 为 的 风险 。 有 些 时 序 电路 无 法 使 用 阻塞 赋值 ， 无 论 顺序 是 什么 。 


4.6 有 限 状 态 机 


有 限 状 态 机 (FSM ) 由 状态 寄存 器 和 两 个 组 合 逻 辑 块 组 成 ， 用 于 计算 当前 状态 和 输入 下 的 下 


一 个 状态 和 输出 ， 如 图 3-22 所 示 。 状 态 机 的 HDL 描述 
相应 地 划分 成 3 部 分 来 对 状态 寄存 器 、 下 一 个 状态 逻 
辑 和 输出 逻辑 建 模 。 

HDL 例 4. 30 描述 了 3.4.2 节 中 的 3 分 频 计 数 器 有 
限 状 态 机 。 它 提供 异步 复位 来 初始 化 有 限 状 态 机 。 状 
态 寄 存 器 使 用 触发 器 的 普通 风格 。 下 一 个 状态 和 输出 
逻辑 块 是 组 合 逻 辑 。 

SynplifyPremier 综合 工具 仅 产 生 状 态 机 的 框图 和 状 
态 转换 图 ， 它 没有 显示 逻辑 门 或 弧 线 上 的 输入 和 输出 ， 
以 及 状态 。 因 此 ， 注 意 是 否 已 经 在 HDL 代码 中 正确 地 
说 明 有 限 状态 机 。 图 4-25 中 的 3 分 频 计 数 器 有 限 状 态 
机 的 状态 转换 图 与 图 3-28b FAW. WA 








state[2:0] 


表示 SO 是 复 图 4-25 divideby3fsm 综合 后 的 电路 
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位 状态 。3 分 频 计 数 器 有 限 状 态 机 的 门 级 实现 在 3.4.2 节 中 说 明 。 


HDL 例 4. 30 3 分 频 计数 器 有 限 状 态 机 


SystemVeilog VHDL 
module divideby3FSM(input logic clk, library IEEE; use IEEE.STD_LOGIC_1164.a11; 


ROE: “ES AOE, entity divideby3FSM is 
port(clk, reset: in STD_LOGIC; 
; out STD_LOGIC); 


output logic y); 
typedef enum logic [1:0] (SO, S1, S2} statetype; 
statetype [1:0] state, nextstate; onii as 
// state register 


always_ff @(posedge clk, posedge reset) architecture synth of divideby3FSM is 


IT Treset) State CGO type statetype is (SO, Sl, S2); 
EYRE stitt seatik signal state, nextstate: statetype; 
begin 
// next state logic -- state register 
always_comb process(clk, reset) begin 
case (state) if reset then state <= S0; 
SO: nextstate <=S1; elsif rising_edge(clk) then 
SL: nextstate <=S2; state <= nextstate; 
$2: nextstate <=S0; end if; 
default: nextstate<=S0; end process; 
dhatase -- next state logic 
// output logic nextstate <= S1 when state=S0 else 
assign y=(state==S0); S2 when state=S1 else 
endmodule $0; 
typedef 语句 定义 了 statetype 为 一 个 2 位 logic 值 ， -- output logic 


y <= '1' when state=S0 else ‘0'; 


CA 3 个 可 能 的 值 : SO. S1, S2. state 和 nextstate 都 是 end: 
statetype 类 型 的 信号 。 

枚 举 编码 默认 为 数字 排序 : SO =00、S1 =01、S2 =10。 
编码 可 以 由 用 户 显 式 设置 。 不 过 ,综合 工具 只 是 建议 而 不 要 求 
用 户 必须 显 式 设 置 编码 。 比 如 ， 下 面 的 代码 段 把 状态 编码 为 3 


该 例子 定义 了 一 个 新 的 枚 举 数据 类 型 state- 
type， 它 有 3 个 可 能 的 值 sS0、sl、s2。state 
和 nextstate 都 是 statetype 类 型 的 信号 。 使 
用 枚 举 代 替 选 择 状态 编码 ，VHDL 让 综合 器 自由 


Teas: | . i - . 地 搜索 各 种 状态 编码 ， 以 便 选择 一 个 最 好 的 。 
ae oh gg ogic [2:0] {SO=3'b001, S1=3'b010, S2=3'b100} 当 state 为 s0 时 ， 输出 y 为 1。 不 相等 比较 


使 用 / = 。 为 了 当 状 态 是 除了 so 以 外 的 任何 值 时 


注意 ， 怎 样 使 用 case 语句 定义 状态 转换 表 。 因 为 下 一 个 产生 1 的 输出 ， 把 比较 改 为 state/ = 50。 


状态 逻辑 必须 是 组 合 逻 辑 ， 所 以 dafault 是 必需 的 ， 即 使 状 
AS 2'b11 不 会 出 现 。 

当 状 态 为 so 时 ， 输 出 y 为 1。 如 果 a 等 于 b， 相 等 比较 a 
= =b 等 于 1， 否 则 等 于 0。 不 相等 比较 a! =b 则 相反 ， 如 果 
a 不 等 于 b， 则 为 1。 


注意 ， 状 态 使 用 枚 举 数据 类 型 来 命名 ， 而 不 使 用 二 进 制 数 值 来 表示 。 这 使 得 代码 的 可 读 性 
更 高 也 更 易 修 改 。 

如 果 ， 因 为 某 些 原因 ， 需 要 在 状态 S0 ASI 使 输出 为 HIGH， 那 么 输出 逻辑 应 该 按 如 下 
修改 。 


SystemVerilog VHDL 
// mee -- RUBS 
assign y=(state==S0 | state== $1); y <= '1' when (state=S0 or state=S1) else '0'; 


下 面 两 个 例子 描述 了 3.4.3 节 中 的 模式 识别 器 有 限 状 态 机 。 代 码 展示 了 如 何 使 用 case 和 
让 语句 ， 根 据 输入 和 当前 状态 产生 下 一 个 状态 和 输出 的 逻辑 。 这 里 给 出 了 Moore 型 状态 机 和 
Mealy 型 状态 机 的 模块 。 在 Moore 型 状态 机 (HDL 例 4.31) 中 ， 输 出 只 与 当前 状态 有 关 ， 而 在 
Mealy 型 状态 机 (HDL 例 4. 32) 中 ， 输 出 逻辑 与 当前 状态 和 输入 有 关 。 
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HDL 例 4.31 模式 识别 器 的 Moore 型 有 限 状态 机 


SystemVeilog VHDL 


module patternMoore(input logic clk, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
input logic reset, 
input logica, 
output logic y); 


entity patternMoore is 
port(clk, reset: in STD_LOGIC; 


: a: in STO_LOGIC; 
typedef enum logic [1:0] {SO, S1, S2) statetype; y: out STD_LOGIC); 
statetype state, nextstate; end; 

// state register architecture synth of patternMoore is 
always_ff @(posedge clk, posedge reset) type statetype is (SO, Sl, S2); 
if (reset) state <= S0; signal state, nextstate: statetype; 
else state <=nextstate; begin 


-- state register 


/7 next state logic process(clk, reset) begin 


always_comb 


case (state) if reset then state <= S0; 
j isi ] <= ; 
SO: if (a) nextstate=S0; es a eee k) then state <=nextstate 


else nextstate=Sl1; 


S1: if (a) nextstate=S2; end process; 


else nextstate=Sl1; ~- next state logic 
S2: if (a) nextstate=S0; process(all) begin 
else nextstate=Sl1; case state is 
default: nextstate=S0; when SO => 
endcase if a then nextstate <= S0; 
else nextstate <= S1; 


// output logic 





: end if; 
i a when Si => 
RE Te if a then nextstate <= $2; 
注意 ， 如 何在 状态 寄存 器 中 使 用 非 阻 塞 赋值 ( < =) a E 
描述 时 序 逻 辑 ， 如 何在 下 一 个 状态 逻辑 中 使 用 阻塞 赋值 when S2 => 
( = ) 描 述 组 合 逻辑 。 if a then nextstate <= S0; 
else nextstate <= S1; 
end if; 
when others => 
nextstate <= $0; 
end case; 
end process; i 
--output logic 
y <= '1' when state=S2 else '0'; 
end; 
a, g 
state [2:0] 
4-26 patternmoore 综合 后 的 电路 
HDL 例 4. 32 模式 识别 器 的 Mealy 型 有 限 状 态 机 
SystemVerilog VHDL 
module patternMealy(input logic clk, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
or a + entity patternMealy is 
wis A aoe ): port(clk, reset: in STD_LOGIC; 
iN ll a: in STD_LOGIC; 
typedef enum logic (SO, S1} statetype; y: out STD_LOGIC); 
statetype state, nextstate; end; 
// state register . architecture synth of patternMealy is 
always_ff @(posedge clk, posedge reset) type statetype is (SO, S1); 
if (reset) state <= S0; signal state, nextstate: statetype; 
else state <= nextstate; begin 


-- State register 
process(clk, reset) begin 
if reset then state <= S0; 


// next state logic 
always_comb 
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case (state) elsif rising_edge(clk) then state <= nextstate; 
S0: if (a) nextstate=S0; end if; 
else nextstate=Sl; end process; 


Sl: if (a) nextstate=S0; 


else nextstate=Sl; ~~ next state logic 


default: nextstate=S0; process(al'l) begin 
Bn GE case state is 
when SO => 
// output logic if a then nextstate <= S0; 
assign y=(a & state==S1); else nextstate <= S1; 
endmodule end if; 
when Sl => 
if a then nextstate <= 50; 
else nextstate <= S1; 


end if; 
when others => 
nextstate <= S0; 
end case; 
end process; 


-- output logic 
y <= '1' when (a= "1" and state=S1) else '0'; 
end; 





4-27 patternMealy 综合 后 的 电路 


4.7 数据 类 型 ， 
本 节 将 更 深入 地 讲解 SystemVerilog 和 VHDL 类 型 的 微妙 差别 。 


4.7.1 SystemVerilog 


在 SystemVerilog 出 现 之 前 ，Verilog 主要 使 用 两 种 类 型 : reg 和 wire。 尽 管 名 字 如 此 ， 但 
reg 信号 不 一 定 与 寄存 器 相关 联 。 这 对 初学 者 来 说 是 一 个 巨大 的 混淆 根源 。SystemVerilog 引入 
了 logic 类 型 来 消除 歧义 。 因 此 ， 本 书 着 重 介绍 logic 类 型 。 本 节 详 细 讲 解 reg 和 wire 类 
型 ， 以 利于 你 阅读 旧 的 Verilog 代码 。 

在 Verilog 中 ， 如 果 信 号 出 现在 always 模块 中 < = 或 = 的 左边 ， 那 么 它 必须 声明 为 rego 
否则 ， 它 应 该 声明 为 wire。 因 此 ， 一 个 reg 信和 号 可 能 是 一 个 触发 器 、 锁 存 器 或 者 组 合 逻 辑 的 
输出 ， 取 决 于 敏感 信号 列表 和 always 模块 的 语句 。 

输入 和 输出 端口 默认 为 wire 类 型 ， 除 非 它 们 的 类 型 被 明确 定义 为 reg。 下 面 的 例子 展示 
了 如 何 使 用 传统 Verilog 来 描述 触 改 器。 注意 clk 和 da 默认 为 wire 类 型 ， 而 a 则 明确 定义 为 
reg 类 型 ， 因 为 gq 出 现在 always 模块 中 < = 的 左边 。 


module flop(input clk, 
input [3:0] d, 
output reg [3:0] q); 
always @(posedge clk) 


endmodule 


SystemVerilog 引入 logic KA, logic 类 型 是 reg 类 型 的 同义词 ， 避 免 误 导 用 户 它 实际 
上 是 否 是 一 个 触发 锅 的 猜想 。 而 且 ，SystemVerilog 放宽 了 assign 语句 和 分 层 端口 实例 的 规 
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WW, ALA logic 变量 可 以 在 always 模块 的 外 面 使 用 ， 而 传统 语法 要 求 在 always 模块 的 外 
面 使 用 wire 变量 。 因 此 ， 几 乎 所 有 的 SystemVerilog 信号 都 可 以 是 logic 类 型 。 但 也 有 例外 ， 
如 果 信 号 有 多 个 驱动 源 ( 例 如 ， 三 态 总 线 ) 则 必须 声明 为 net 类 型 ， 如 HDL 例 4. 10 所 描述 的 。 
当 logic 信号 不 小 心 连接 到 多 驱动 源 时 ， 这 个 规则 允许 SystemVerilog 生成 错误 信息 而 不 是 生 
成 x 值 。 

net 最 常用 的 类 型 是 wire 或 tri。 这 两 种 类 型 是 同 义 的 ,但 是 传统 上 wire 类 型 用 于 单 信 
号 源 驱 动 ，tri 类 型 用 于 多 信号 源 驱 动 。 因 此 ， 在 SystemVerilog 中 ，wire 类 型 已 上 废弃， 因为 
logic 类 型 更 常用 于 单 驱 动 源 信号 。 


“tri 变量 由 一 个 或 多 个 信和 号 源 驱 动 为 某 表 4-7 net 解决 方案 
MEAN, 它 就 呈现 那个 值 。 当 它 未 被 驱动 时 ， ”ia 类 型 ERAR 溃 突 的 驱动 源 
它 呈 现 浮 空 值 (z)。 当 它 被 多 个 信号 源 驱动 为 tri ze 
不 同 的 值 (0、1 Kx), 它 呈 现 为 不 确定 值 trireg 以 前 的 值 x 
(x), triand Z 0 如 果 有 0 
同时 存在 其 他 使 用 不 同方 法 解决 未 驱动 或 nie i en 
者 多 驱动 源 问题 的 net 类 型 。 这 些 类 型 很 少 使 ne t 


用 , 但 可 以 在 任何 使 用 tri 类 型 的 地 方 作为 
tri 的 替代 (例如 ， 用 于 有 多 个 驱动 源 的 信号 ) ， 每 个 类 型 都 在 表 4-7 中 描述 。 


4.7.2 VHDL 


与 SystemVerilog 不 同 ，VHDL 要 求 严格 的 数据 类 型 系统 以 便 保证 用 户 不 出 现 错误 , 但 有 时 
这 也 会 有 些 繁琐。 


尽管 STD_LOGIC 非常 重要 ,但 它 却 没有 直接 建立 在 VHDL 内 。 它 是 IEEE. STD_LOGIC_ 


1164 库 的 一 部 分 。 因 此 ， 在 前 面 的 例子 中 ， 所 有 文件 都 必须 包含 库 语句 。 

mH., IEEE. STD LOGIC 1164 缺少 对 STD LOGIC VECTOR 数据 的 基本 运算 ， 如 整数 相 
加 、 比 较 、 移 位 和 转换 等 运算 。 这 些 运算 最 终 都 被 添加 到 IEEE. NUMERIC_STD_UNSIGNED 库 
的 VHDL 2008 标准 中 。 

VHDL 还 有 一 个 BOOLEAN 类 型 ， 它 包含 两 个 值 : true 和 false。BOOLEAN 值 由 比较 运 
算 返 回 ( 如 相等 比较 s = "0 " )， 它 也 用 在 条 件 语句 中 ， 如 when 和 if。 尽 管 我 们 可 能 认为 
BOOLEAN true 应 该 等 于 STD LOGIC’1’, BOOLEAN false 应 该 等 于 STD LOGIC ‘0’, , 但 
实际 上 这 两 个 类 型 在 VHDL 2008 标准 制定 之 前 是 不 可 以 互 换 的 。 例 如 ， 在 旧 的 VHDL 标准 代码 
中 ， 必须 这 样 写 : 

y <= dl when (s='1') else d0; 

而 在 VHDL 2008 标准 中 ，when 语句 自动 将 s 从 STD LOGIC 转换 成 BOOLEAN 类 型 ， 因 此 
上 述 语句 可 以 简化 为 : 

y <= dl when s else d0; 


甚至 在 VHDL 2008 标准 中 ， 它 仍然 需要 写 为 : 
q <= "1" when (state=S2) else '0'; 


而 不 是 : 
q <= (state=S2); 


AA (state = S2) 返 回 一 个 BOOLEAN 类 型 的 结果 ， 这 个 结果 不 能 直接 赋值 给 STD LOGIC 
类 型 信号 Yo 
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尽管 我 们 没有 声明 任何 信号 为 BOOLEAN ， 但 是 它们 在 比较 中 自动 产生 转换 为 BOOLEAN， 
并 在 条 件 语 句 中 使 用 。 类 似 地 ，VHDL 用 INTEGER 类 型 表示 正 数 和 负数 。INTEGER 类 型 的 信 
号 值 从 -2”~2”-1。 整 数值 用 于 做 总 线 的 标识 。 例 如 ， 在 如 下 语句 中 

y <=a(3) and a(2) and a(1) and a(0); 


0、1、2 和 3 就 是 作为 选择 信号 a 的 位 的 索引 的 整数 。 不 能 直接 用 STD LOGIC 或 者 STD_LOG- 
IC_VECTOR 信和 号 来 标识 总 线 。 必 须 把 信号 转换 成 INTEGER 类 型 。 这 将 由 下 面 的 例子 来 说 明 。 
这 个 例子 是 一 个 8:1 复 用 器 ， 它 用 3 位 标识 从 向 量 中 选择 1 位 。TO INTEGER 函数 在 
IEEE. STD LOGIC_UNSIGNED 库 中 定义 ， 它 把 STD _ LOGIC VECTOR 类 型 转换 成 INTEGER 的 
正 (无 符号 ) 值 。 


library IEEE; 
use IEEE.STD_LOGIC_1164.a11; 
use IEEE.NUMERIC_STD_UNSIGNED.al1; 


entity mux8 is 
port(d: in STD_LOGIC_VECTOR(7 downto 0); 中 

s: in STD_LOGIC_VECTOR(2 downto 0); 
y: out STD_LOGIC); 

end; 

architecture synth of mux8 is 6 

begin 

y <= d(TO_INTEGER(s)); 

end; 


VHDL 严格 定义 out 端口 只 能 用 于 输出 。 例 如 ， 以 下 2 输入 与 门 和 3 输入 与 门 的 代码 就 是 
非法 的 VHDL 代码 ， 因 为 v 是 输出 且 它 用 于 计算 wo 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity and23 is 

port(a, b, c: in STD_LOGIC; 

v, Ww: out STD_LOGIC); 

end; 
architecture synth of and23 is 
begin 

v <=a and b; 

w <= vand c; 
end; 


为 了 解决 这 个 问题 ，VHDL 定义 了 一 个 特别 的 端口 类 型 buffer。 连 接 到 buffer 端口 
的 信号 像 输 出 一 样 工 作 ， 但 可 以 在 模块 内 使 用 。 以 下 是 改正 的 实体 定义 。Verilog 和 System- 
Verilog 没有 这 个 限制 ， 也 不 需要 buffer 端口 。 


VHDL 2008 删除 了 这 个 限制 ， 允 许 out 端口 为 可 读 一 


的 ,但 是 这 个 改变 在 写 这 本 书 时 还 未 被 Synplify CAD 
工具 文 持 。 


entity and23 is 


port(a, b, c: in STD_LOGIC; 图 4-28 and23 综合 后 的 电路 
v: buffer STD_LOGIC; 
w: out STD_LOGIC,); 





end; 


大 多 数 运算 ， 如 加 法 、 减 法 和 布尔 逻辑 ， 都 是 一 样 的 ， 无 论 数 是 有 符号 数 还 是 无 符号 数 。 
然而 ， 数 值 比较 、 乘 法 和 算术 右 移 对 于 有 符号 补 码 和 无 符号 二 进 制 数 的 运算 是 不 一 样 的 。 这 些 
运算 将 在 第 5 章 详细 讲解 。HDL 例 4. 33 描述 了 如 何 表示 有 符号 数 。 
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HDL $4.33 al) 无 符号 乘法 器 b) 有 符号 乘法 器 


SystemVerilog 


// 4.33(a): unsigned multiplier 
module multiplier(input logic [3:0] a, b, 
output logic [7:0] y); 
assign y=a*b; 
endmodule 


// 4.33(b): signed multiplier 
module multiplier(input logic signed [3:0] a, b, 
output logic signed [7:0] y); 
assign y=a * b; 
endmodule 


在 SystemVerilog 中 ， 信 号 默认 为 无 符号 数 。 增 加 了 
signed 修饰 符 后 (例如 ，logic signed [3:0] a)， 信 
号 作为 有 符号 数 处 理 。 


4.8 参数 化 模块 


VHDL 


-~ 4.33(a): unsigned multiplier 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 
use IEEE,NUMERIC_STD_UNSIGNED.al1; 


entity multiplier is 
port(a, b: in STD_LOGIC_VECTOR(3 downto 0); 
y: out STD_LOGIC_VECTOR(7 downto 0)); 
end; 


architecture synth of multiplier is 
begin 
y <= a * D 
end; 
VHDL 使 用 NUMERIC_STD_UNSIGNED 库 来 对 STD 
_LOGIC_VECTOR 执行 算术 运算 和 比较 运算 。 这 些 向 量 
作为 无 符号 数 处 理 。 


use IEEE.NUMERIC_STD_UNSIGNED.al1; 
VHDL 也 在 IEEE. NUMERIC_STD 库 里 定义 了 UN- 


SIGNED 和 SIGNED 数据 类 型 ， 但 这 些 数据 类 型 涉及 类 
型 转换 ， 这 些 超出 了 本 章 的 范围 。 


目前 为 止 ， 所 有 模块 的 输入 和 输出 的 宽度 都 是 固定 的 。 例 如 ， 我 们 必须 分 别针 对 4 位 和 8 
位 宽 的 2:1 复 用 器 定义 不 同 的 模块 。 使 用 参数 化 模块 ，HDL 允许 可 变 的 位 宽度 。 
HDL 例 4. 34 描述 了 一 个 默认 宽度 为 8 的 参数 化 的 2:1 复 用 器 ， 然 后 使 用 它 创 建 一 个 8 位 


和 一 个 12 位 的 4:1 RHA o 


HDL 例 4. 35 描述 了 一 个 更 好 的 参数 化 模块 的 应 用 一 一 译 码 器 。 使 用 case 语句 描述 大 型 
N:2" 译 码 器 很 麻烦 。 但 使 用 参数 化 代码 来 设置 合适 的 输出 位 为 1 却 很 简单 。 具 体 地 ， 译 码 器 使 
用 阻塞 赋值 将 所 有 位 设置 为 0， 然 后 将 合适 的 位 改变 为 1。 


HDL 例 4. 34 
SystemVerilog 


module mux2 
#( parameter width=8) 
(input logic [width-1:0] d0, dl, 
input logic S, 
output logic [width-1:0] y); 


assign y=s ? dl : d0; 
endmodule 
SystemVerilog 允许 在 输入 和 输出 之 前 使 用 # (parame- 
ter…) 语 句 定 义 参数 。Parameter 语句 包括 一 个 默认 值 
(8) ， 这 里 称 为 width。 输 入 和 输出 的 位 数 依 赖 于 这 个 
参数 。 


module mux4_8(input logic [7:0] d0, dl, d2, d3, 
input logic [1:0] s, 
output logic [7:0] y); 


logic [7:0] low, hi; 


mux2 lowmux(d0, dl. s[0], low); 

mux2 himux(d2, d3, s[0], hi); 

mux2 outmux(low, hi, s[1], y); 
endmodule 


8 位 4:1 复 用 器 使 用 它们 默认 宽度 实例 化 3 个 2:1 复 
用 器 。 
相反 ， 在 实例 名 之 前 ，12 位 4:1 复 用 器 mux4 12 使 


参数 化 的 NN 位 2:1 复 用 器 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.all; 


entity mux2 is 
generic(width: integer :=8); 
port (do, 
dl: in STD_LOGIC_VECTOR(width-1 downto 0); 
ss in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(width-1 downto 0)); 
end; 


architecture synth of mux2 is 
begin 

y <= d1 whens else d0; 
end; 


generic 语句 包括 width 的 默认 值 (8)。 这 个 值 
为 整数 类 型 。 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux4_8 is 
port(d0, dl, d2, 
d3: in STD_LOGIC_VECTOR(7 downto 0); 
s: in STD_LOGIC_VECTOR(1 downto 0); 
y: out STD_LOGIC_VECTOR(7 downto 0)); 
end; 


architecture struct of mux4_8 is 
component mux2 
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hae 





用 #( ) 重 写 默认 宽度 ， 如 下 所 示 。 

module mux4_12(input logic [11:0] d0, dl, d2, d3, 
input logic [1:0] s. 
output logic [11:0] y); 


logic [11:0] low, hi; 


mux2 #(12) lowmux(d0, dl, s[0], low); 
mux2 #(12) himux(d2, d3, s[0], hi): 
mux2 #(12) outmux(low, hi, sf1], y): 












generic(width: integer :=8); 
port(d0， 
di: in STD_LOGIC_VECTOR(width-1 downto 0); 
s: in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(width-1 downto 0)); 
end component; 
signal low, hi: STD_LOGIC_VECTOR(7 downto 0); 
begin 
lowmux: mux2 port map(d0, dl, s(0), low); 


endaoduie himux: mux2 port map(d2, d3, s(0), hi); 
’ outmux: mux2 port map(low, hi, s(1), y); 
不 要 把 表示 延迟 的 # 符 号 与 定义 和 重 写 参数 的 #(… end: 
RM 8 位 4:1 复 用 器 mux4 8 使 用 它们 的 默认 宽度 实例 
化 3 个 2:1 BAAR. 
AAR, 12 位 4:1 复 用 器 mux4 12 使 用 generic 
map 覆盖 默认 宽度 ， 如 下 所 示 。 
lowmux: mux2 generic map(12) 
port map(d0, dl, s(0), low); 
himux: mux2 generic map(12) 
port map(d2, d3, s(0), hi); 
outmux: mux2 generic map(12) 
port map(low, hi, s(1), y); 
mux2 12 上 mux2 12 | 
'S | 1S | l 
= dO[ 11:0] y{ 110m Sh ao 1:0) yi oHe Lor 
=% d} [11:0] | i s d1[11:0] | 
lowmux outmux | 
mux2_12 | 
iS 
MOL dol 1:0] y[11:0 
ig rd 1 [11:0] 
himux 
4-29 mux4 12 综合 后 的 电路 
HDL 例 4.35 参数 化 的 N:2" 译 码 器 
SystemVerilog VHDL 


module decoder 
#(parameter N=3) 
(input logic [N-1:0] a, 
output logic [2**N-1:0] y); 


always_comb 
begin 
y=0; 
y[a]=1; 
end 
endmodule 


2** 代表 2”。 


library IEEE; use IEEE.STD_LOGIC_1164.all; 
use IEEE. NUMERIC_STD_UNSIGNED.al1; 


entity decoder is 
generic(N: integer :=3); 
port(a: in STD_LOGIC_VECTOR(N-1 downto 0); 
y: out STD_LOGIC_VECTOR(2**N-1 downto 0)); 
end; 


architecture synth of decoder is 
begin 
process(al]) 
begin 
y <= (OTHERS => '0'); 
y(TO_INTEGER(a)) <='1'; 
end process; 
end; 


2** N ARH2”,. 


HDL 还 提供 generate 语句 产生 基于 参数 值 的 可 变数 量 的 硬件 。generate 支持 for 循 
环 和 if 语句 来 确定 产生 多 少 和 什么 类 型 的 硬件 。HDL 例 4. 36 说 明 如 何 使 用 generate 语句 
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产生 一 个 由 2 输入 与 门 级 联 构成 的 N 输入 AND 功能 。 当 然 ， 对 于 这 个 应 用 中 ， 使 用 缩 位 运算 
符 将 更 简单 明了 ， 但 该 例子 阐述 了 硬件 生成 器 的 通用 原理 。 
使 用 generate 语句 必须 注意 ， 它 很 容易 不 经 意 地 生成 大 量 的 硬件 。 


HDL 例 4. 36 参数 化 的 NN 输入 与 门 
SystemVeilog VHDL 


module andN library IEEE; use IEEE.STO_LOGIC_1164.a11; 
#( parameter width=8) ee N 


(input logic [width=1:0] oid generic(width: integer := 8); 


Sotpus togte y); port(a: in STD_LOGIC_VECTOR(width-1 downto 0); 
genvar i; y: out STD_LOGIC); 
logic [width-1:0] x; end; 
generate architecture synth of andN is 
assign x[0]=a[0]; signal x: STD_LOGIC_VECTOR(width-1 downto 0); 
for(i=l; i<width; i=i+l) begin: forloop begin 
assign xCil=ali] & x[i-1]; x(0) <= a(0); 
end gen: for i in 1 towidth-1 generate 
aaaanaRat x(i) <= ai) and x(i-1); 
PERSE RIES end generate; 
assign y=x(width-1): y <= x(width-1); 
endmodule end; 
for 语句 循环 通过 i= ] ’ 2; aiik width -1 以 便 产 生成 循环 变量 i 不 需 声 明 。 


生 许多 连续 的 与 门 。 在 generate for 循环 中 的 begin 
后 面 必须 有 “:” 和 一 个 任意 的 标识 (在 这 个 例子 中 是 
forloop). 





4-30 andN 综合 后 的 电路 


4.9 测试 程序 


测试 程序 (testbench) 是 用 于 测试 其 他 模块 ( 称 为 被 测 设备 (Device Under Test, DUT) ) 的 硬件 
描述 语言 模块 。 测 试 程序 包含 了 向 被 测 设 备 提 供 输入 的 语句 ， 以 便 检 查 是 否 产生 理想 的 正确 输 
出 。 输 入 和 期 待 的 输出 模式 称 为 测试 向 量 (test vector) 。 

考虑 测试 4. 1. 1 节 中 计算 y=abce+abc+apc 的 sillyfunction 模块 。 这 是 一 个 简单 的 
模块 ， 所 以 可 以 通过 提供 所 有 8 个 可 能 的 测试 回 量 来 执行 全 部 的 测试 。 

HDL 例 4. 37 说 明了 一 个 简单 的 测试 程序 。 它 实例 化 DUT， 之 后 提供 输入 。 阻 塞 式 赋值 和 
延迟 用 于 提供 合适 的 输入 顺序 。 使 用 者 必须 检查 模拟 结果 以 验证 是 否 产生 正确 输出 。 测试 程序 
也 像 其 他 的 HDL 模块 那样 被 模拟 ， 然 而 它们 不 能 被 综合 。 

检查 输出 是 否 正 确 的 过 程 比 较 枯 燥 且 容易 出 错 。 而 且 ， 当 设计 在 脑海 里 还 是 很 清晰 时 ， 
判断 输出 结果 是 否 正 确 比 较 简 单 。 如 果 做 了 很 小 的 修改 ， 且 数 周 后 需要 重新 测试 ， 那 么 判 
断 输 出 是 否 正 确 就 变 得 比较 麻烦 了 。 一 个 更 好 的 方法 是 编写 自 检测 试 程序 ， 如 HDL fi 4. 38 
所 示 。 

为 每 个 测试 向 量 编写 代码 依然 是 元 繁 的 工作 ， 尤 其 是 需要 大 量 测试 向 量 的 模块 中 。 一 个 比 
较 好 的 方法 是 把 测试 向 量 放 在 一 个 单独 的 文件 中 。 测 试 程序 简单 地 从 文件 中 读 取 测试 向 量 ， 向 
DUT 输入 测试 向 量 ， 检 查 DUT 输出 值 是 否 与 输出 向 量 一 致 ， 重 复 这 个 过 程 直 到 测试 向 量 文件 
的 结尾 。 
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ae 


HDL $i) 4.37 测试 





SystemVerilog 


module testbenchl(); 
logica, b,c, y? 


// instantiate device under test 
sillyfunction dut(a, b, c. y); 


// apply inputs one at a time 
initial begin 
a=0; b=0; c=0; #10; 


c=1; #10; 
bel; c=0; #10; 
c=1; #10; 
a=1; b=0; c= 0: #10; 
c=1; #10; 
b=1; c=0; #10; 
c=1; #10; 
end 
endmodule 


在 模拟 开始 时 Initial 语句 执行 该 段 内 的 语 
句 。 在 本 例 中 ， 它 首先 提供 输入 模式 000， 然 后 等 
待 10 个 时 间 单 位 。 然 后 提供 001， 等 待 10 个 时 间 
单位 ， 以 此 类 推 ， 直 到 提供 了 所 有 8 个 可 能 的 输 
人 。Initial 语句 只 能 在 测试 程序 上 用 于 模拟 ， 
不 能 用 于 综合 为 实际 硬件 的 模块 中 。 第 一 次 启动 
时 ， 硬 件 无 法 执行 一 系列 特殊 的 步骤 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11;, 


entity testbenchl is -- no inputs or outputs 
end; 


architecture simof testbenchl is 
component sillyfunction 
port(a, b,c: in STD_LOGIC; 
y: out STD_LOGIC); 
end component; 
signal a, b, c, y: STD_LOGIC; 
begin 
-- instantiate device under test 
dut: sillyfunction port map(a, b, €. y); 


-- apply inputs one at a time 
process begin 
a<= ' 0's b<= "0": c <= °0°s wait for 10 ns: 


c<='l'; wait for 10 ns; 
D<='1’; C= "0"; wait for 10 ns; 
c<='l'; wait for 10 ns; 


a <= '1'; b<=‘'0';: c <= '0'; wait for 10 ns; 


c<='l'; wait for 10 ns; 
b= "1"; o<e '0": wait for 10 ns; 
C <= 'l"s wait for 10 ns; 
wait; -- wait forever 
end process; 
‘end: 


process 语句 最 先 提供 输入 模式 000， 等 待 10ns。 然 后 它 提 
供 001， 等 待 10ns， 以 此 类 推 直 到 提供 了 所 有 8 个 可 能 的 输入 。 

最 后 ， 该 过 程 将 无 限 等 待 ; 否则 ， 该 过 程 再 次 开始 ， 重 复 
地 提供 测试 向 量 的 模式 。 


HDL 例 4. 38 自 检 测试 程序 


' SystemVerilog 


module testbench2(); 
logica, b,c, y; 


// instantiate device under test 
sillyfunction dut(a, b, c, y); 


// apply inputs one at-a time 

// checking results 

initial begin 
a=0; b=0; c=0; #10; 
assert (y === 1) else $error("000 failed."); 
c=1; #10; 
assert (y === 0) else $error("001 failed.”); 
b=1;c=0; #10; 
assert (y === 0) else $error("010 failed.”); 
cl; #10; 
assert (y === 0) else $error("011 failed."); 
a=1;b=0;c=0; #10; 
assert (y === 1) else $error("100 failed."); 
c=l; #10; 
assert (y === 1) else $error("101 failed."); 
b=1;c=0; #10; 
assert (y === 0) else $error("110 failed."); 
c=1; #10; 
assert (y === 0) else $error("111 failed."); 

end 

endmodule 


SystemVerilog 的 assert 语句 检查 特定 条 件 是 
否 成 立 。 如 果 不 成 立 ， 则 执行 else 语句 。else 
语句 中 的 $ error 系统 任务 用 于 输出 描述 assert 
错误 的 错误 信息 。 在 综合 过 程 中 assert 将 被 
忽略 。 

在 SystemVerilog 中 ， 可 以 在 不 包括 x 和 z 值 的 


VHDL 
library IEEE; use 1EEE.STD_LOGIC_1164.a11; 


entity testbench2 is -- no inputs or outputs 
end; 


architecture sim of testbench2 is 
component sillyfunction 
port(a, b, c: in STD_LOGIC; 
y: out STD_LOGIC); 
end component; 
signal a, b, c. y: STD_LOGIC; 
begin 
-- instantiate device under test 
dut: sillyfunction port map(a, b, c, y); 


-- apply inputs one at a time 
-- checking results 
process begin 
a <= '0'; b <='0': c <= '0'; wait for lO ns; 
assert y= '1' report "000 failed."; 
Cm Ss wait for 10 ns; 
assert y= "0' report "001 failed.”; 
<a" ee 0 wait for 10 ns; 
assert y= '0" report "010 failed."; 
C Re “T's wait for 10 ns; 
assert y='0' report "011 failed."; 
a <= '1"; b <= "0'; c <= ‘0's wait for 10 ns; 
assert y='1' report "100 failed. ”; 
c <= '1'; wait for 10 ns; 
assert y='1' report "101 failed.”; 
b Cm 1's CKO": wait for 10 ns; 
assert y= "0 report "110 failed.”; 
G: Kee" LNs wait for 10 ns; 
assert y= '0" report "111 failed.”; 
wait; -- wait forever 
end process; 
end; 


硬件 描述 语言 


信号 之 间 使 用 = = 或 者 ! = 进行 比较 。 测 试 程序 分 别 
使 用 = = = 和 ! = = 运算 符 判断 相等 或 不 相等 ， 因 


为 这 些 运算 符 可 以 对 包含 x 和 z 的 运算 数 正 确 操 作 。 


137 


assert 语句 检查 条 件 ， 如 果 条 件 不 满足 时 输出 report 
子 句 中 的 信息 。assert 只 在 模拟 时 有 意义 ， 在 综合 时 无 
意义 。 


HDL fj 4. 39 说 明了 这 种 测试 程序 。 测 试 程序 使 用 没有 敏感 信号 列表 的 always/process 
语句 产生 一 个 时 钟 ， 这 样 它 会 连续 不 断 地 重复 运行 。 在 模拟 的 开始 ， 它 从 一 个 文本 文件 读 取 测 
试 向 量 ， 提 供 两 个 周期 的 reset 脉冲 。 虽 然 时 钟 信号 和 复位 信和 号 在 组 合 逻 辑 测试 中 不 是 必需 
的 ， 但 它们 也 包含 在 代码 中 ， 因 为 它们 在 测试 时 序 DUT 中 是 很 重要 的 。example. tv 是 包含 


二 进 制 格式 输入 和 期 待 输 出 的 文本 文件 : 


000_1 
001_0 
010_0 
011_0 
100_1 
101_1 
110_0 
111_0 


HDL $4.39 BMRA 


SystemVerilog 


module testbench3(); 
logic clk, reset; 
logic a, b, c, y, yexpected; 
logic [31:0] vectornum, errors; 
logic [3:0] testvectors[10000:0]; 


// instantiate device under test 
sillyfunction dut(a, b, c, y); 


// generate clock 
always 
begin 
clk=1; #5; clk=0; #5; 
end 


// at start of test, load vectors 
// and pulse reset 
initial 
begin 
$readmemb(“example.tv", testvectors); 
vectornum=0; errors=0; 
reset=1; #27; reset=0; 
end 


// apply test vectors on rising edge of clk 
always @(posedge clk) 
begin 
#1; {a, b, c, yexpected} = testvectors[vectornum]; 
end 


// check results on falling edge of clk 
always @(negedge clk) 
if (~reset) begin // skip during reset 
if (y ! == yexpected) begin // check result 
$display("Error: inputs=%b", (a, b, c}); 


VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 
use IEEE.STD_LOGIC_TEXTIO.ALL; use STD. TEXTIO.all; 


entity testbench3 is -- no inputs or outputs 
end; 


architecture sim of testbench3 is 
component sillyfunction 
port(a, b, c: in STD_LOGIC; 
y: out STD_LOGIC); 
end component; 
signal a, b, c, y: STD_LOGIC; 
signal y_expected: STD_LOGIC; 
signal clk, reset: STD_LOGIC; 
begin 
-- instantiate device under test 
dut: sillyfunction port map(a b, c, y); 


-~ generate clock 
process begin 
clk <= "lr wait for 5ns; 
clk <= '0'; wait for 5ns; 
end process; 


-- at start of test, pulse reset 

process begin 
reset <= '1'; wait for 27 ns; reset <= '0'; 
wait; 

end process; 


-~ run tests 
process is 
file tv: text; 
variable L: line; 
variable vector_in: std_logic_vector(2 downto 0); 


$display(" outputs=%b (%b expected)", y, yexpected); variable dummy: character; 


errors=errors41; 

end 

vectornum = vectornum+1; 

if (testvectors[(vectornum] === 4'bx) begin 
$display("%d tests completed with %d errors”, 

vectornum, errors); 

$finish; 

end 

end 
endmodule 


$readmem 将 二 进 制 数字 文件 读 入 testvec- 
tors 数组 中 。 Sreadmemh 与 之 相似 ， 但 它 读 取 


variable vector_out: std_logic; 
variable vectornum: integer :=0; 
variable errors: integer :=0; 

begin 
FILE_OPEN(tv, “example.tv", READ_MODE); 
while not endfile(tyv) loop 


-- change vectors on rising edge 
wait until rising_edge(clk); 


-- read the next line of testvectors and split into pieces 
readline(tv, L); 

read(L, vector_in); 

read(L, dummy); -- skip over underscore 
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十 六 进 制 数字 的 文件 。 

代码 的 下 一 块 在 时 钟 的 上 沿 后 等 待 一 个 时 间 单 
位 (以 防止 时 钟 和 数据 同时 改变 造成 的 混乱 ) ， 然 
后 根据 当前 测试 向 量 中 的 4 位 设置 3 位 输入 (a、b 
和 c) 和 期 望 的 输出 (yexpected)。 

测试 程序 将 期 望 的 输出 yexpected 与 生成 的 
输出 y 比较 ， 如 果 它 们 不 相等 ， 则 输出 一 条 错误 信 
B.% b MS da 分别 表示 以 二 进 制 或 者 十 进 制 输出 
f. flin, $display ( “% b % b”, y, yex- 
pected); 表示 以 二 进 制 输出 y 和 yexpected 两 
“MES h 以 十 六 进 制 输出 数值 。 

这 个 进程 重复 直到 tesevector 数组 中 没有 
更 多 可 用 的 测试 向 量 。 $ finish 结束 模拟 。 

注意 ， 即 使 SystemVerilog 模块 最 多 支持 10 001 
个 测试 向 量 ， 但 是 它 在 执行 文件 中 8 个 的 测试 向 量 
后 就 结束 模拟 。 


read(L, vector_out); 
(a, b, c) <= vector_in(2 downto 0) after 1 ns; 
y_expected <= vector_out after 1 ns; 


~- check results on falling edge 
wait until falling_edge(clk); 


if y /= y_expected then 
report “Error: y=" & std_logic'image(y);: 
errors :=errors+1; 

end if; 


vectornum := vectornum+1; 
end loop; 


-~ summarize results at end of simulation 
if (errors=0) then 
report "NO ERRORS -~ " & 
integer’ image(vectornum) & 
"tests completed successfully." 
severity failure; 
else 
report integer’ image(vectornum) & 
"tests completed, errors=" & 


integer’ image(errors) 
severity failure; 
end if; 
end process; 
end; 


VHDL 代码 使 用 文件 读 取 指 令 已 经 超出 了 本 章 的 范围 ， 但 
这 里 也 给 出 了 一 个 VHDL 自 检 测试 程序 的 概况 。 


在 时 钟 的 上 升 沿 向 被 测 设备 提供 新 的 输入 ， 在 时 钟 的 下 降 沿 检查 输出 。 测 试 程序 可 以 在 发 
生 错 误 时 报告 错误 。 可 以 在 模拟 结束 时 ,测试 程序 输出 应 用 的 全 部 测试 向 量 数 和 检测 的 错 
误 数 。 

对 这 样 简单 的 电路 ,使 用 HDL 例 4.39 中 的 测试 程序 有 点 过 分 了 。 然 而， 经 过 简单 的 修 
改 ， 它 可 以 测试 更 复杂 的 电路 ， 修 改 的 内 容 主 要 包括 : 修改 example. tv、 实 例 化 新 的 DUF, 
修改 一 些 代码 行 来 设置 输入 和 检查 输出 。 


4.10 总结 


对 于 现代 数字 设计 人 员 ， 硬 件 描述 语言 (HDL) 是 十 分 重要 的 工具 。 当 学 会 了 SystemVerilog 
或 者 VHDL， 就 可 以 比 手工 绘制 图 表 更 快 地 描述 数字 系统 。 而 且 因 为 修改 时 只 需要 修改 代码 ， 
而 不 是 烦琐 地 重 绘 电路 图 ， 所 以 调试 周期 也 会 更 快 。 然 而 ， 如 果 不 熟 悉 代 码 所 代表 的 硬件 ， 使 
用 硬件 描述 语言 的 调试 周期 可 能 会 更 长 。 

硬件 描述 语言 用 于 模拟 和 综合 。 在 系统 转化 为 硬件 前 逻辑 模拟 是 在 计算 机 上 进行 测试 的 有 
效 方法 。 模 拟 器 可 以 检查 物理 硬件 中 不 可 能 被 测量 的 系统 中 的 信号 值 。 逻 辑 综合 把 硬件 描述 语 
言 代 码 转换 成 数字 逻辑 电路 。 

最 重要 的 是 : 编写 硬件 描述 语言 代码 是 描述 一 个 真实 存在 的 硬件 ， 而 不 是 编写 一 个 软件 程 
序 。 很 多 初学 者 的 常见 错误 是 不 考虑 准备 产生 的 硬件 而 编写 硬件 描述 语言 代码 。 如 果 不 知道 要 
表示 的 硬件 是 什么 ， 那 么 肯定 也 不 能 得 到 想 要 的 东西 。 相 反 ， 应 该 从 画 系统 的 结构 图 开始 ， 区 
分 哪些 部 分 是 组 合 逻 辑 ， 哪 些 部 分 是 时 序 逻 辑 或 有 限 状 态 机 。 然 后 使 用 可 以 描述 目标 硬件 的 正 
确 风 格 为 每 一 个 部 分 编写 硬件 描述 语言 代码 。 


习题 
以 下 习题 可 以 用 你 习惯 的 硬件 描述 语言 完成 。 如 果 可 以 使 用 模拟 器 ， 那 么 测试 你 的 设计 。 
输出 波形 并 解释 它们 如 何 证 明 设计 是 可 行 的 。 如 果 可 以 使 用 综合 器 ， 综 合 你 的 代码 。 输 出 生成 
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的 电路 图 ， 解 释 为 什 


4. 1 


4.2 


4. 3 


4. 4 


4.5 


4.6 


4.7 


4.8 


4.9 


4.10 使 用 4:1 复 用 器 和 非 门 重新 实现 习题 4.9 的 内 容 。 
4. 11 


么 它 符合 预想 。 
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画 一 个 用 下 面 的 HDL 代码 描述 的 电路 图 。 简 化 电路 图 以 便 使 用 最 少 的 门 。 


SystemVerilog 
module exercisel(input logica, b. C, 
output logic y, z); 
assigny=a&b&c|a&b&~c|a&~b&c; 


assignz=a&b|~a&~b; 
endmodule 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity exercisel is 
port(a, b. c: in STD_LOGIC; 
Ws 23 out STDO_LOGIC); 
end; 


architecture synth of exercisel is 
begin 
y <= (a and b and c) or (a and b and not c) or 
(a and not b and c); 
z <= (a and b) or (not a and not b); 
end; 


画 一 个 用 下 面 的 HDL 代码 描述 的 电路 图 。 简 化 电路 图 以 便 使 用 最 少 的 门 。 


SystemyVerilog 


module exercise2(input logic [3:0] a, 
output logic [1:0] y}; 
always_comb 
if (a[0]) y=2*b11; 
else if (a[1]) y=2'b10; 
else if (a[2]) y=2'b01; 
else if (a[3]) y=2'b00; 
else y=a[1:0); 
endmodule 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity exercise2 is 
port(a: in STD_LOGIC_VECTOR(3 downto 0); 
y: out STD_LOGIC_VECTOR(1 downto 0)); 
end; 


architecture synth of exercise2 is 
begin 
process(all) begin 
if a(0) then y <= "11"; 
elsif a(1) then y <= "10"; 
elsif a(2) then y <= "01"; 
elsif a(3) then y <= "00"; 
else y <= a(l downto 0); 
end if; 
end process; 
end; 


编写 一 个 HDL 模块 ， 它 计算 4 输入 XOR 函数 。 输 入 为 ai， 输出 为 y。 
为 习题 4. 3 编写 一 个 自 检测 试 程序 。 生 成 一 个 包含 所 有 16 个 测试 用 例 的 测试 向 量 文件 。 
模拟 电路 运行 ， 说 明 它 的 工作 。 在 测试 向 量 文件 中 引入 一 个 错误 , 说明 测 试 程序 报告 


错误 。 


编写 一 个 叫 作 minority 的 HDL 模块 。 它 接收 a、b 和 c 3 个 输入 。 产 生 一 个 输出 y, 


如 果 至 少 两 个 输入 为 FALSE 则 输出 TRUE, 


编写 一 个 HDL 模块 ， 用 于 十 六 进 制 的 7 段 显 示 译 码 器 。 译 码 器 应 该 也 能 够 处 理 A、B、 


C, D, E, 以 及 0 ~9。 


为 习题 4.6 编写 一 个 自 检 测试 程序 。 生 成 一 个 包含 所 有 16 个 测试 用 例 的 测试 向 量 文件 。 
模拟 电路 运行 ， 说 明 它 的 工作 。 在 测试 向 量 文件 中 引入 一 个 错误 ， 说 明 测 试 程序 报告 


错误 。 


编写 一 个 8:1 复 用 器 模块 mux8, WAX S,.,. dO. dl, d2, d3, d4, 


输出 为 y。 


d5, do, Gt, 


编写 一 个 结构 模块 ， 它 使 用 复 用 器 逻辑 计算 逻辑 函数 y =a b+bc +abc。 使 用 习题 4.8 


中 的 8:1 RHA 


4.5.4 节 指 出 ， 如 果 以 合适 的 顺序 给 出 赋值 ， 则 综合 器 也 可 以 使 用 阻塞 赋值 正确 地 描 
述 。 设 计 一 个 简单 的 时 序 电 路 ， 无 论 采 用 何 种 顺序 它 都 不 能 用 阻塞 赋值 描述 。 
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4.25 给 出 以 下 HDL 代码 描述 的 有 限 状 态 机 的 状态 转换 图 。 这 种 有 限 状态 机 用 于 某 些 微 处 理 


编写 一 个 8 输入 优先 电路 的 HDL 模块 。 
编写 一 个 2:4 译 码 器 的 HDL 模块 。 


使 用 习题 4. 13 中 的 2:4 PEAS RE 3 个 实例 和 一 些 3 输入 与 门 ， 编 写 一 个 6:64 PERS Ae BY 


HDL 模块 。 


编写 HDL 模块 ， 实 现 习题 2. 13 中 的 布尔 表达 式 。 


编写 HDL 模块 ， 实 现 习 题 2.26 中 的 电路 。 
编写 HDL 模块 ， 实 现 习题 2.27 中 的 电路 。 
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编写 HDL 模块 ， 实 现 习题 2. 28 的 逻辑 功能 。 注 意 如 何 处 理 那些 无 关 项 。 


编写 HDL 模块 ， 实 现 习 题 2. 35 的 功能 。 


编写 HDL 模块 ， 实 现 习题 2. 36 HAEREA o 


编写 HDL 模块 ， 实 现 习 题 2. 37 的 修改 的 优先 级 译 码 器 。 

编写 HDL 模块 ， 实 现 习题 2. 38 的 二 进 制 到 温度 计 码 的 转换 器 。 
编写 一 个 模块 ， 实 现 问 题 2. 2 中 判断 一 个 月 天 数 的 功能 。 

给 出 以 下 HDL 代码 描述 的 有 限 状 态 机 的 状态 转换 图 。 


SystemVerilog 


module fsm2(input logic clk, reset, 
input logic a, b, 
output logic y); 


logic [1:0] state, nextstate; 


parameter SO = 2'b00; 
parameter Sl = 2'b0l; 
parameter S2 = 2'bl0; 
parameter S3 = 2'bll; 


always_ff @(posedge clk, posedge reset) 
if (reset) state <=S0; 
else state <= nextstate;: 


always_comb 
case (state) 
S0: if (a ^ b) nextstate=S1; 


else nextstate= 5S0; 
Sl: if (a & b) nextstate=52; 
else nextstate= S0; 
S2: if (a | b) nextstate=S3; 
else nextstate = 50; 
S3: if (a | b) nextstate=S3; 
else nextstate= 50; 
endcase 


assign y=(state== S1) | (state==S2); 
endmodule 


器 的 分 支 预 测 。 


VHDL 
library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity fsm2 is 
port(clk, reset: in STD_LOGIC; 
a, Di: in STD_LOGIC; 
y: out STD_LOGIC); 
end; 


architecture synth of fsm2 is 
type statetype is (SO, 51, 52, $3); 
signal state, nextstate: statetype; 
begin 
“process(clk, reset) begin 
if reset then state <= S50; 
elsif rising_edge(clk) then 
State <=nextstate; 
end if; 
end process; 


process(all) begin 
case state is 
when SO => if (a xor b) then 
nextstate <= $1; 
else nextstate <= S0; 
end if; 
when S1 => if (a and b) then 
nextstate <= S2; 
else nextstate <= S0; 
end if; 
when S2 => if (a orb) then 
nextstate <= $3; 
else nextstate <= S0; 
end if; 
when 93 => if (aor b) then 
nextstate <= 53; 
else nextstate <= S0; 
end if; 
end case; 
end process; 


y <= '1' when ((state=S1) or (state=S2)) 
else '0'; 


end; 
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4. 26 
4. 27 


4. 28 
4. 29 
4. 30 
4.31 


4. 32 
4. 33 


SystemVerilog 


module fsml(input logic clk, reset, 
input logic taken, back, 
output logic predicttaken); 


logic [4:0] state, nextstate; 


parameter SO = 5'b00001; 
parameter SI = 5'b00010; 
parameter S2 = 5'b00100; 
parameter S3 = 5'b01000; 
parameter S4 = 5'b10000; 


always_ff @(posedge clk, posedge reset) 
if (reset) state <= S2; 
else state <= nextstate; 


always_comb 
case (state) 


SO: if (taken) 


nextstate=S1; 


else nextstate=S0; 
Sl: if (taken) nextstate=S2; 
else nextstate=S0; 
S2: if (taken) nextstate=S3; 
else nextstate=Sl1; 
S3: if (taken) nextstate=S4; 
else nextstate=S2; 
S4: if (taken) nextstate=S4; 
else nextstate=S3; 
default: nextstate=S2; 
endcase 


assign predicttaken=(state == $4) | 


(state == $3) | 
(state == S2 && back); 
endmodule 
为 SR 锁 存 器 编写 一 个 HDL 模块 。 
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VHDL 
library IEEE; use LEEE.STD_LOGIC_1164. all; 


entity fsml is 
port(clk, reset: in STD_LOGIC; 
taken, back: in STD_LOGIC; 
predicttaken: out STD_LOGIC); 
end; 


architecture synth of fsml is 
type statetype is (SO, S1, $2, $3, S4); 
Signal state, nextstate: statetype; 
begin ~ 
process(clk, reset) begin 
if reset then state <= 52; 
elsif rising_edge(clk) then 
state <= nextstate; 
end if; 
end process; 


process(all) begin 
case state is 
when SO => if taken then 
nextstate <= $1; 
else nextstate <= S0; 
end if; 
when S1 => if taken then 
nextstate => S2; 
else nextstate <= S0; 
end if; 
when S2 => if taken then 
nextstate <= $3; 
else nextstate <= S1; 
end if; 
when 53 => if taken then 
nextstate <= S4; 
else nextstate <= S2; 
end if; 
when $4 => if taken then 
nextstate <= S4; 
else nextstate <= S3; 
end if; 
when others => nextstate <= 82; 
end case; 
end process; 


—— output logic 
predicttaken <= '1' when 
((state=S4) or (state=S3) or 
(state=S2 and back='1')) 
else '0'; 
end; 


K JK 触发 器 编写 一 个 HDL 模块 。 触 发 器 的 输入 为 ck、J 和 天 ， 输 出 为 @。 在 时 钟 的 上 
FFE, WRJ=K=0, M O 保持 后 来 的 值 。 如 果 J=1， 则 @ 设置 为 1， 如 果 天 =1， 那 么 
Q 重 置 为 0。 如 果 =K=1， 那么 0 设置 为 相反 的 值 。 

为 图 3-18 的 锁 存 器 编写 一 个 HDL 模块 。 用 一 条 赋值 语句 为 每 一 个 门 赋值 。 每 个 门 的 延 
RBA 1 单位 或 者 lns。 模 拟 锁 存 器 ， 说 明 它 能 够 正确 操作 。 然 后 增加 反 相 器 的 延迟 。 
设置 多 长 的 延迟 才能 避免 竟 争 产生 的 锁 存 器 故障 呢 ? 

为 3.4.1 节 的 交通 灯 控 制 器 编写 HDL 模块 。 

为 例 3. 8 中 的 游行 模式 交通 灯 控 制 器 的 分 解 状 态 机 编写 3 个 HDL 模块 。 模 块 名 字 分 别 
X controller, mode, lights, 它们 的 输入 和 输出 如 图 3-33b 所 示 。 
编写 一 个 描述 图 3-42 电路 的 HDL 模块 。 

为 习题 3. 22 中 的 图 3-69 给 出 的 有 限 状 态 机 的 状态 转换 图 编写 一 个 HDL 模块 。 

为 习题 3. 23 中 的 图 3-70 给 出 的 有 限 状 态 机 的 状态 转换 图 编写 一 个 HDL 模块 。 
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4. 34 
4.35 
4, 36 
4. 37 
4. 38 
4. 39 
4.40 
4. 41 
4. 42 
4. 43 


- 4.44 


4. 45 


RAF 


为 习题 3. 24 中 的 改进 的 交通 灯 控 制 器 编写 一 个 HDL 模块 。 

为 习题 3.25 中 的 蜗牛 女儿 的 例子 编写 一 个 HDL 模块 。 

为 习题 3. 26 中 的 苏打 汽水 售卖 机 的 例子 编写 一 个 HDL 模块 。 
为 习题 3. 27 中 的 格雷 码 计数 器 编写 一 个 HDL 模块 。 

为 习题 3. 28 中 的 UP/DOWN 格雷 码 计 数 句 编写 一 个 HDL 模块 。 
为 习题 3. 29 中 的 有 限 状态 机 编写 一 个 HDL 模块 。 

为 习题 3. 30 中 的 有 限 状 态 机 编写 一 个 HDL 模块 。 

为 问题 3. 2 中 的 连续 2 补 码 器 编写 一 个 HDL 模块 。 

为 习题 3. 31 中 的 电路 编写 一 个 HDL 模块 。 

为 习题 3. 32 中 的 电路 编写 一 个 HDL 模块 。 

为 习题 3. 33 中 的 电路 编写 一 个 HDL 模块 。 

为 习题 3. 34 中 的 电路 编写 一 个 HDL 模块 。 可 能 需要 用 到 4. 2. 5 节 中 的 全 加 器 。 


SystemVerilog 习题 
以 下 习题 用 SystemVerilog 完成 。 


4. 46 
4. 47 


4. 48 


4. 49 
4. 50 


SystemVerilog 中 声明 为 tri 的 信号 代表 什么 意思 ? 


重 写 HDL 例 4. 29 的 synbad 模块 。 使 用 非 阻塞 赋值 ， 但 是 把 代码 修改 为 用 两 个 触发 器 


产生 正确 的 同步 器 。 
考虑 以 下 两 个 SystemVerilog 模块 。 它 们 的 功能 一 样 吗 ?” TIRE A em EEF. 


module codel(input logicclk, a,b,c, 
output logic y); 
logic x; 
always_ff @(posedge clk) begin 
x<=a&b; 


endmodule 


module code2 (input logica, b,c, clk, 
output logic y); 
logic x; 
always_ff @(posedge clk) begin 
y <=x|c; 
x<=a&b; 
end 
endmodule 


在 每 个 赋值 中 用 = 代替 < = ， 重 新 讨论 习题 4. 48 的 问题 。 


以 下 的 SystemVerilog 模块 表示 你 在 实验 室 看 到 的 学 生 的 错误 。 说 出 每 个 模块 的 错误 ， 并 


指出 如 何 修改 它 。 


a) module latch(input logic clk, 
input logic [3:0] d, 
output reg [3:0] q); 
always @(clk) 
if (clk) q = d; 
endmodule 


b) module gates(input logic [3:0] 4, b, 
output logic [3:0] yl, y2, y3, y4, y5); 


always @(a) 
begin 
yl=a&b; 
y2=a |b; 
y3=a ^ D; 
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y4=~(a &b); 
y5=~(a | b); 
end 
endmodule 


c) module mux2(input logic [3:0] d0, dl, 
input logic S, 
output logic [3:0] y); 


always @(posedge s) 
if (s) y <=di; 
else y<=d0; 

endmodule 


d) module twoflops(input logic clk, 
input logic d0, dl, 
output logic q0., ql); 


always @(posedge clk) 
ql=dl; 
q0=d0; 
endmodule 


e) module FSM(input logic clk, 
input logica, 
output logic outl, out2); 


logic state; 


// next state logic and register (sequential) 
always_ff @(posedge clk) 
if (state==0) begin 
if (a) state <=1; 
end else begin 
if (~a) state <=0; 
end 


always_comb // output logic (combinational) 
if (state==0) outl=1; 
else out2=1; 
endmodule 


f) module priority(input logic [3:0] a, 
output logic [3:0] y); 


always_comb 
if (a[3]) y=4'b1000; 
else if (a[2]) y = 4'b0100; 
else if (a[1]) y = 4'b0010; 
else if (a[0]) y =4'b0001; 
endmodule 


g) module divideby3FSM(input logic clk, 
input logic reset, 
output logic out); 


logic [1:0] state, nextstate; . 


parameter SO = 2'b00; 
parameter Sl = 2'b0l; 
parameter S2 = 2'bl0; 


// State Register 

always_ff @(posedge clk, posedge reset) 
if (reset) state <= S0; 
else state <= nextstate; 


// Next State Logic 
always @(state) 
case (state) 


S0: nextstate = Sl; 
Sl: nextstate = S2; 
S2: nextstate = SQ; 


endcase 


// Qutput Logic 
assign out=(state== S82); 
endmodule 
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h) module mux2tri(input logic [3:0] dO, dl, 
input logic Ss 
output tri [3:0] y); 
tristate t0(d0, s, y); 
tristate tl(dl, s.y); 


endmodule 
i) module floprsen(input logic | clk, 
input logic reset, 
input logic set, 


input logic [3:0]d, 
output logic [3:0] q); 


always_ff @(posedge clk, posedge reset) 
if (reset) q <=0; 
else q <=d; 


always @(set) 
if (set) gq <= 1; 
endmodule 


j) module and3(input logica, b,c, 
output logic y); 


logic tmp; 


always @(a, b, c) 
begin 
tmp <= a å b; 
y <=tmpa&c; 
end 
endmodule 


VHDL 习题 


以 下 习题 用 VHDL 完成 。 
4.51 #E VHDL, 为 什么 写 


q <= '1' when state=S0 else '0'; 


而 不 写 


q <= (state=S0); 


4.52 以 下 每 个 VHDL 模块 都 包含 一 个 错误 。 为 了 简单 ， 只 给 出 了 结构 描述 。 假 设 library 
使 用 子 句 和 entity 声明 都 是 正确 的 。 解 释 错误 并 修正 它 。 


a) architecture synth of latch is 
begin 
process(clk) begin 
if clk='1l' then q <= d; 
end if; 
end process; 
end; 


b) architecture proc of gates is 
begin 
process(a) begin 
Yl <=a and b; 
y2 <= a or b's 
y3 <= a xor b; 
y4 <= a nand b; 
y5 <=a nor b; 
end process; 
end; 


c) architecture synth of flop is 
begin 
process(clk) 
if rising_edge(clk) then 
q <=d; 
end; 
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d) architecture synth of priority is 
begin 
process(all) begin 
if a(3) then y <= "1000"; 
elsif a(2) then y <= "0100"; 
elsif a(1) then y <= "0010"; 
elsif a(0) then y <= "0001"; 
end if; 
end process; 
end; 
e) architecture synth of divideby3FSM is 
type statetype is (SO, S1, S2); 
Signal state, nextstate: statetype; 
begin 
process(clk, reset) begin 
if reset then state <= S0; 
elsif rising_edge(clk) then 
state <= nextstate; 
end if; 
end process; 


process(state) begin 
case state is 
when SO => nextstate <= S51; 
when S1 => nextstate <= S2; 
when S2 => nextstate <= S0; 
end case; 
end process; 


q <= 'l' when state=S0 else '0'; 
end; 
f) architecture struct of mux2 is 
component tristate 
port(a: in STD_LOGIC_VECTOR(3 downto 0); 

en: in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(3 downto 0)); 

end component; 


begin 
tO: tristate port map(d0, s, y); 
tl: tristate port map(dl, s, y); 
end; 
g) architecture asynchronous of floprs is 
begin . 
process(clk, reset) begin 
if reset then 
q < *0"; 
elsif rising_edge(clk) then 
q <=d; 
end if; 
end process; 


process(set) begin 


if set then 
q <= ' 1 ' : 
end if; 232 
end process; : 
end; 236 


面试 问题 

下 述 问题 在 数字 设计 工作 的 面试 中 曾经 被 问 到 。 

4.1 编写 HDL 代码 ， 它 用 sel 信号 产生 32 位 的 result 信和 号 来 门 控 32 位 data RA. MR 
sel A TRUE, M] result =data. AM, result 等 于 0。 

4.2 用 例子 说 明 SystemVerilog 中 的 阻塞 赋值 和 非 阻 塞 赋值 有 什么 不 同 。 


4.3 以 下 的 SystemVerilog 语句 将 做 什么 ? 
result=| (data[15:0] & 16'hC820); 237 
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到 目前 为 止 ， 我 们 已 经 介绍 了 使 用 布尔 表达 式 、 电 路 原理 图 和 硬件 描述 语言 来 设计 组 合 
电路 和 时 序 电 路 。 本 章 将 详细 介绍 数字 系统 中 常见 的 组 合 电路 和 时 
序 电 路 模块 。 这 些 模块 主要 包括 算术 电路 、 计 数 嚣 、 移 位 寄存 器 、 
存储 器 阵列 和 人 逻辑 阵列 。 这 些 模块 不 仅 自 和 喘 有 重要 人 作用， 而且 还 说 
明了 层次 化 、 模 块 化 和 规整 化 的 原则 。 复 杂 模 块 可 以 以 层次 化 的 方 
法 由 更 简单 的 模块 (如 逻辑 门 电 路 、 复 用 器 、 译 码 器 等 ) 组 成 。 每 个 
模块 都 有 定义 明确 的 接口 ， 当 基础 实现 不 重要 时 ， 可 以 视 为 黑 盒 。 
每 个 模块 的 规则 结构 都 易于 扩展 为 不 同 的 规模 。 第 7 章 将 使 用 这 些 
模块 构建 微 处 理 器 。 


5.2 算术 电路 


算术 电路 是 计算 机 的 主要 模块 。 计 算 机 和 数字 逻辑 可 以 实现 很 多 
算术 功能 : 加 法 、 减 法、 比较 、 移 位 、 乘 法 和 除法 。 本 节 将 介绍 实现 
这 些 运算 的 硬件 。 


5.2.1 加 法 


加 法 是 数字 系统 中 最 常见 的 操作 之 一 。 首 先 考察 两 个 1 位 二 进 制 
数 如 何 相 加 。 然 后 再 扩展 到 位 二 进 制 数 。 加 法 器 还 表明 速度 和 硬件 
复杂 度 之 间 的 不 同 折 中 。 

1. 半 加 器 

首先 从 构建 1 位 半 加 器 (half adder) 开始 。 如 图 5-1 所 示 ， 半 加 器 
有 两 个 输入 4 和 B， 两 个 输出 S 和 C,,。S 是 4 和 B 的 和 。 如 果 4 和 号 都 是 1，$ 就 是 2, 但 2 不 
能 用 1 位 二 进 制 数 表示 。 因 此 ， 用 男 一 列 输出 进位 C,, 表 示 。 半 加 器 可 以 用 一 个 XOR 门 电路 和 
一 个 AND 门 电 路 实现 。 | | 

在 多 位 加 法 器 中 ，C,, 会 被 相 加 或 者 进位 到 下 一 个 高 位 。 例 如 ， 在 图 5-2 中 以 黑体 标注 的 
进位 Coa E l 位 加 法 的 第 一 列 的 输出 ， 同 时 也 是 加 法 的 第 二 列 的 输入 Cu。 然 而 ， 半 加 器 缺少 一 
个 输入 C;, 来 接收 前 一 列 的 输出 C,,。 下 一 节 介 绍 的 全 加 器 将 解决 这 个 问题 。 

2. 全 加 器 

如 图 5-3 所 示 ，2. 1 节 介 绍 的 全 加 器 (full adder) 接 收 进位 C;,。 图 中 还 给 出 了 5 和 C,, 的 输 
出 表达 式 。 

3. 进位 传播 加 法 器 

一 个 入 位 加 法 器 将 两 个 入 位 输入 (A4、B) 和 一 位 进位 C;, 相 加 ， 产 生 一 个 W 位 结果 $ 和 一 个 输 
出 进位 Cao BA 1 位 进位 将 传播 到 下 一 位 中 ， 所 以 这 种 加 法 器 通常 称 为 进位 传播 加 法 器 (Carry 
Propagate Adder, CPA), CPA 的 符号 如 图 5-4 IR, RRT A, B, Ss 是 总 线 而 不 是 单独 一 位 外 ， 它 
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与 全 加 器 很 像 。3 种 常见 的 CPA KRYETAR, FETT RENIN a TAI a 
全 加 器 





GS A ki. 8 
0 0.:0 0 90 
0 0 1 0 1 
上 Wo or a 
D pf J 1 0 
kyo 0 0 1 
k i Oot 1 0 A B 
Pa EE 1 ug N AN 
1 A Bs ‘tv z P 
0001 out 
+0101 S=ADBOC, N 
0110 C„„=AB+AC„+ BC, S 
图 5-1 1 位 半 加 器 图 5-2 进位 图 5-3 1 位 全 加 器 图 5-4 进位 传播 加 法 器 


(1) 行 波 进位 加 法 器 
构造 N 位 进位 传播 加 法 器 的 最 简单 方法 就 是 把 N 个 全 加 器 串联 起 来 。 如 图 5-5 所 示 的 32 
位 加 法 器 ， 它 称 为 行 波 进 位 加 法 器 (ripple-carry adder) ， 其 中 一 级 的 Cu 就 是 下 一 级 的 Cao X 
是 模块 化 和 规整 化 的 一 个 应 用 范例 : 全 加 器 模块 在 一 个 更 大 的 系统 中 被 多 次 重用 。 行 波 进 位 加 
法 器 有 一 个 缺点 : 当 比较 大 时 ,运算 速度 会 慢 下 来 。 例 如 ， 在 图 5-5 中 ，S: 依赖 于 Cy, Cy 
依赖 于 Co, Co LKF C;， 以 此 类 推 ， 所 有 都 依赖 于 黑体 标注 的 C。 可 以 看 出 ， 进 位 通过 
进位 链 形 成 行 波 。 加 法 器 的 延迟 tj,. 直 接 随 位 数 的 增加 而 增加 ， 如 式 (5-1) 所 示 ， 其 中 二, 是 全 
IN aie AY) HEI o 
bai = Ntra (5-1) 


Sy Seo S, Sy 
图 5-5 32 位 行 波 进位 加 法 器 

(2) FEAT MEINE at 

大 型 行 波 进位 加 法 器 运算 缓慢 的 根本 原因 是 进位 信号 必须 通过 加 法 器 中 的 每 一 位 传播 。 先 
行进 位 加 法 器 (Carry-Lookahead Adder, CLA) 是 另 一 种 类 型 的 进位 传播 加 法 器 ， 它 解决 进位 问 
题 的 方法 是 : 把 加 法 费 分 解 成 寿 干 块 ， 同 时 增加 电路 ， 当 每 块 一 有 进位 时 就 快速 确定 此 块 的 输 
出 进位 。 因 此 它 不 需要 等 待 进位 行 波 通过 一 块 内 的 所 有 加 法 器 ， 而 是 直接 先行 通过 该 块 。 例 
如 ， 一 个 32 位 加 法 器 可 以 分 解 成 8 个 4 位 的 块 。 

先行 进位 加 法 器 使 用 产生 (C) 和 传播 ( 尸 ) 两 个 信号 来 描述 一 列 或 者 一 块 如 何 确定 进位 输出 。 
在 不 考虑 进位 输入 的 情况 下 ， 如 果 加 法 器 的 第 i 列 必 然 产生 了 一 个 输出 进位 ， 此 列 称 为 产生 进 
fto INA AIS i UE A AN 8B, 都 为 1 时， 必定 产 生 进 位 C;。 因 此 第 i 列 的 产生 信号 G6; 可 以 这 样 
计算 ，G, =4,B;。 当 有 进位 输入 时 ， 第 i 列 产生 了 一 个 进位 输出 ， 那 么 此 列 就 称 为 传播 进位 。 
如 果 A, Me B; 为 1， 则 第 i 列 将 传播 一 个 进位 输入 Cn BE, P, =4;+B,。 利 用 这 些 定义 ， 可 
以 为 加 法 器 的 特定 列 重 写 进 位 逻辑 。 如 果 加 法 器 的 第 i 列 将 产生 一 个 进位 6;， 或 者 传播 一 个 进 
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位 输入 PC, ,， 则 它 将 产生 进位 输出 C;。 表 达 式 为 
C. = A,B, + (A, + B,)C,_, = G + P;C;, (5-2) 
产生 和 传播 的 定义 可 以 扩展 到 多 位 块 。 如 果 一 块 在 不 考虑 进位 输入 的 情况 下 也 能 产生 进位 
输出 ， 则 称 其 产生 进位 。 如 果 一 块 在 有 进位 输入 时 能 产生 进位 ， 则 称 其 传播 进位 。 定 义 Cj 和 
P, 为 从 第 i 列 到 第 j 列 块 的 产生 信号 和 传播 信号 。 
一 块 产生 进位 的 条 件 是 : 最 高 有 效 列 产生 一 个 进位 ， 或 者 最 高 有 效 列 传播 进位 且 前 面 的 列 
产生 了 进位 ， 以 此 类 推 。 例 如 ， 一 个 第 3 列 到 第 0 列 的 块 的 产生 逻辑 为 
CG = 6G, + P,(6, FPG + P,G,)) (5-3) 
一 块 传播 进位 的 条 件 是 : 块 中 所 有 的 列 都 能 传播 进位 。 例 如 ， 一 个 从 第 3 列 到 第 0 列 的 传 
播 逻辑 为 


Pio = P,P,P,P, (5-4) 
使 用 块 的 产生 信号 和 传播 信号 ， 可 以 根据 块 的 进位 输入 C ;快速 计算 块 的 进位 输出 Co 
C.-= Gij + Pl, (5-5) 


5-6a 显示 了 一 个 由 8 个 4 位 块 组 成 的 32 位 先行 进位 加 法 器 。 每 块 包含 一 个 4 位 的 行 波 
进位 加 法 器 和 一 些 根据 进位 输入 计算 该 块 进位 输出 的 先行 控制 逻辑 ， 如 图 5-6b 所 示 。 为 了 简 
洁 ， 图 中 没有 画 出 用 于 计算 每 一 位 4 和 有 号 的 产生 信号 6, 和 输出 信号 已 所 需要 的 AND 门 和 OR 
门 。 同 样 ， 先 行进 位 加 法 器 也 体现 了 模块 化 和 规整 化 。 


B3128 A31:28 B2724 42724 B34 474 By A30 


aS CLA|Cx eo CLA | Cz 


S; 1:28 2724 
a) 32 位 先行 进位 加 法 器 





b) 4 位 CLA 块 


图 5-6 


所 有 的 CLA 块 同 时 计算 一 位 和 块 产 成 信号 及 传播 信号 。 关 键 路 径 从 第 一 个 CLA 块 中 计算 
Co 和 Cs 开始。 接着 Ci 通过 每 块 中 的 AND/OR 门 电路 直接 向 前 传送 给 C,,,， 直 到 最 后 一 块 。 在 
大 型 加 法 器 中 ,这 比 等 待 进位 行 波 通过 加 法 器 的 每 一 个 连续 位 快 很 多 。 最 后 ， 通 过 最 后 一 块 的 
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关键 路 径 包 含 一 个 短 行 波 进位 加 法 咒 。 因 此 ， 一 个 分 解 为 上 位 块 的 N 位 加 法 器 的 延迟 为 : 


N 
taa = bag T big lock T GG = ji + ktea (5-6) 


其 中 ,为 产生 P, 和 G; 的 单个 产生 /传播 门 (单个 AND 或 OR 门 ) AY REGS, ty go 为 在 上 位 块 中 寻 
找 产生 信号 已 ,和 传播 信号 C,v 的 延迟 ，iAw or 为 从 Caa C,,, BIA k fiz CLA 块 的 最 后 AND/OR 2 
辑 的 延迟 。 当 > 16 时 ， 先 行进 位 加 法 器 一 般 比 行 波 进位 加 法 器 快 很 多 。 然 而 ， 加 法 器 的 延迟 
依然 随 线性 增长 。 

行 波 进位 加 法 器 和 先行 进位 加 法 器 的 延迟 

对 比 32 位 行 波 进位 加 法 器 和 4 位 块 组 成 的 32 位 先行 进位 加 法 器 的 延迟 。 假 设 每 个 两 输入 
门 电路 的 延迟 为 100ps， 全 加 和 需 的 延迟 是 300ps。 

解 : 根据 式 (5-1) ，32 位 行 波 进位 加 法 器 的 传播 延迟 是 32 x300ps =9. 6ns。 

CLA FY) t,, =100ps, toe biek =6 X LOOps =600ps，tnp or =2 X 100ps =200ps。 根 据 式 (5-6), 4 
位 块 组 成 的 32 位 先行 进位 加 法 器 传播 延迟 为 : 100ps + 600ps + (32/4 -1) x200ps + (4 x300ps) = 
3. 3ns， 上 比 行 波 进位 加 法 占 几 乎 快 3 fo < 

(3 ) 前 缀 加 法 器 ” 

前 组 加 法 器 (prefix adder) 扩 展 了 先行 进位 加 法 需 的 产 成 和 传播 逻辑 ， 可 以 进行 更 快 的 加 法 
运算 。 它 们 首先 以 两 列 一 组 计算 C 和 已 ， 之 后 是 4 位 的 块 ， 之 后 是 8 位 的 块 ， 之 后 是 16 位 的 
块 ， 以 此 类 推 ， 直 到 产 成 每 一 列 的 产生 信号 。 从 这 些 产 成 信号 中 计算 和 。 

换言之 ， 前 级 加 法 器 的 策略 是 ， 尽 可 能 快 地 计算 每 一 列 i 的 进位 输入 C,_,， 然 后 使 用 下 式 
计算 和 : 

S; = (A, ® B;) ®© C (5-7) 

定义 列 i= -1 代表 Cj， 所 以 6 =C 且 P_=0。 因 为 如 果 从 列 -1 到 ;=-1 的 块 产生 一 个 
进位 ， 那么 列 i-1 将 产生 进位 输出 ， 所 以 Ca = G,_1._1。 产 成 的 进位 要 么 在 i-1 列 中 产生 ,要 
么 在 前 一 列 中 产生 并 传播 。 因 此 ， 重 写 式 (5-7) 为 


S; = (A; @ B;) Gi- (5-8) 
因此 ， 主要 问题 就 是 快速 计算 所 有 块 的 产生 信号 Ge Gi, 3 Gare Gy ay 
Gy_2,-10 KHEM Pi Pasis Phan Camie t Py -2, ,一 起 称 为 前 缓 (prefix) 。 


图 5-7 是 一 个 N=16 位 的 前 级 加 法 右 。 这 个 加 法 器 从 一 个 预计 算 开始 ， 该 预计 算 用 AND 
Al OR 门 电路 为 4; 和 B EAE PA Go Aa CH log N =4 层 的 黑色 单元 组 成 Cu 和 已 ,的 
前 级 。 一 个 黑色 单元 的 输入 包括 : 从 块 的 i 到 位 的 上 部 分 和 从 和 -1 到 j 位 的 下 部 分 。 它 使 用 
下 式 将 这 两 部 分 组 合 为 整个 从 i 到 j 位 的 块 的 产生 信号 和 传播 信号 : 

G = Gy + Pi Gs (5-9) 

全 = PP ia (5-10) 
换言之 ， 如 果 上 部 分 产生 一 个 进位 或 者 如 果 上 部 分 传播 下 部 分 产生 的 进位 ， 则 一 个 从 到 了 位 
的 块 将 产生 一 个 进位 。 如 果 上 部 分 和 下 部 分 都 传播 进位 ， 则 该 块 也 传播 进位 。 最 后 ， 前 级 加 法 
ar 8 FA SK (5-8 ) 计算 和 。 

总 的 来 说 ， 前 缀 加 法 器 的 延迟 以 加 法 器 位 数 的 对 数 增长 ， 而 不 是 线性 增长 。 它 明显 提高 了 
速度 ， 特 别 当 加 法 器 位 数 超过 32 位 时 ， 但 是 ， 它 比 简 单 的 先行 进位 加 法 器 需要 消耗 更 多 的 硬 
件 资源 。 黑 色 单 元 构成 的 网 络 称 为 前 缓 树 (prefix tree) 。 

使 用 前 绥 树 计算 ， 使 其 执行 延 时 按 输入 位 数 的 对 数 增长 。 这 种 方法 是 很 有 用 的 技术 。 发 挥 
一 下 智慧 ， 它 可 以 应 用 到 其 他 类 型 的 电路 中 (参见 习题 5.7) 。 
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图 5-7 16 (en AR ANIA at 


N 位 前 缀 加 法 器 的 关键 路 径 包 括 已 和 Ci; 的 预计 算 ， 通 过 log,NN 步 的 黑色 前 缀 单元 获得 所 有 

前 级 。 然 后 C,-,,-, 通 过 底部 最 后 的 KOR 门 电 路 计算 5;。N 位 前 缀 加 法 需 的 延迟 可 表示 为 : 
te, = t 寺 16 可 从 (Ra 村 txor (5-11) 

其 中 i, ,ws 是 黑色 前 缀 单元 的 延迟 。 

前 级 加 法 器 的 延迟 

计算 32 位 前 缀 加 法 需 的 延迟 。 假 设 每 一 个 2 输入 门 电路 的 延迟 是 100ps。 

解 : 每 一 个 黑色 前 缀 单元 的 传播 延迟 上 ， 是 200ps( 即 2 个 门 电路 的 延迟 ) 。 因 此 ， 使 用 
式 ($-11) ，32 位 前 缀 加 法 需 的 传播 延迟 是 100ps + log, (32) x200ps + 100ps =1.2ns， 它 比 先行 
进位 加 法 器 快 3 倍 ， 比 例 5. 1 中 的 行 波 进位 加 法 器 快 8 倍 。 在 实践 中 ， 效 益 可 能 没有 那么 大 ， 
但 前 缀 加 法 需 依 然 是 所 有 选择 中 最 快 的 。 < 

4. 小 结 

本 节 介 绍 了 半 加 器 、 全 加 器 和 3 种 进位 传播 加 法 右 ( 行 波 进位 加 法 器 、 先 行进 位 加 法 器 和 
前 组 加 法 器 ) 。 更 快 的 加 法 器 需要 更 多 的 硬件 ， 所 以 成 本 和 功 耗 也 都 更 高 。 设 计 中 选择 合适 的 
加 法 器 需要 充分 考虑 这 些 折 中 。 

硬件 描述 语言 提供 “ + ”操作 来 描述 CPA。 现 代 的 综合 工具 从 众多 可 能 的 实现 方法 中 选 
择 最 便宜 (最 小 ) 的 设计 来 满足 速度 的 要 求 。 这 极 大 地 简化 了 设计 者 的 工作 。HDL 例 5.1 描述 
了 一 个 有 进位 输入 /输出 的 CPA。 
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HDL 例 5.1 加 法 器 


SystemVerilog VHDL 
module adder #(parameter N= 8) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 
(input logic [N-1:0] a, b, use IEEE.NUMERIC_STD_UNSIGNED.ALL; 
input logic cin, 
output logic [N-1:0] s, entity adder is 
output logic cout): generic(N: integer :=8); 
port(a, b: in STD_LOGIC_VECTOR(N-1 downto 0); 
assign (cout, s} =a+b+cin: cin: in STD_LOGIC; 
endmodule S: out STD_LOGIC_VECTOR(N-1 downto 0); 


cout: out STD_LOGIC); 
end; 


architecture synth of adder is 
Signal result: STD_LOGIC_VECTOR(N downto 0); 


begin 
result <= ("0" &a)+("O0" &b) +cin; 
S <= result(N-1 downto 0); 
cout <=result(N); 

end; 





图 5-8 综合 后 的 加 法 器 


5.2.2 减法 


回想 1.4. 6 节 中 的 加 法 器 可 以 使 用 二 进 制 补 码 表示 完成 正 数 和 负数 的 加 法 。 减 法 非常 简 
单 : 改变 减 数 的 符号 ， 然 后 做 加 法 。 改 变 二 进 制 补 码 的 符号 就 是 反 


A B 
转 所 有 的 位 ， 然 后 加 1. = 
为 了 计算 了 =4 -8B， 首 先 创建 减 数 B 的 二 进 制 补 码 。 反 转 B 的 所 YN 4N N XN 
有 位 得 到 B， 然 后 加 1 得 到 -B=B+1。 把 这 个 值 与 被 减 数 4 相 加 ， ae) \ : 
得 到 了 =4+B8+1=4-B。 可 以 通过 进位 传播 加 法 器 得 到 和 ， 其 中 设 

置 C, =1， 加 数 和 被 加 数 分 别 为 4 和 B。 图 5-9 为 减法 器 的 符号 和 实 。。) 电路 符号 ob) 实现 


现 Y=4- 刀 的 基础 硬件 。HDL fil 5. 2 描述 了 一 个 减法 器 。 图 5-9 减法 器 
HDL 例 5.2 减法 器 
SystemVerilog VHDL 
module subtractor #(parameter N= 8) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 
(input logic [N-1:0] a, b, use [EEE.NUMERIC_STD_UNSIGNED.ALL; 
output logic [N-1:0] y); 
entity subtractor is 
assign y=a-—b; generic(N: integer :=8); 
endmodule port(a, b: in STD_LOGIC_VECTOR(N-1 downto 0); 


y: out STD_LOGIC_VECTOR(N-1 downto 0)); 
end; 


architecture synth of subtractor is 
begin 

y <=a-b; 
end; 





152 


5.2.3 比较 器 
比较 器 的 作用 是 判断 两 个 二 进 制 数 是 否 相等 ， 或 者 一 个 比 另 一 个 大 还 是 小 。 比 较 器 的 输入 


第 5 


为 两 个 W 位 二 进 制 数 4 和 B。 有 两 种 常见 类 型 的 比较 带 。 


相等 比较 器 (equality comparator) 产生 一 个 输出 ， 说 明 4 是 否 等 于 B(A ==B)。 量 值 比 较 器 


(magnitude comparator) 产生 一 个 或 者 多 个 输出 ,说 明 4 和 B 的 关系 值 。 


相等 比较 器 的 硬件 相对 简单 。 图 5-11 给 出 了 相等 比较 器 的 电路 符号 和 4 位 相等 比较 器 的 
实现 。 它 首先 通过 XNOR 门 电路 检查 4 AB 中 的 每 一 列 的 对 应 位 是 否 相 等 。 如 果 列 的 每 一 位 都 


相等 ， 则 它们 就 相等 。 


量 值 比较 首先 计算 4 -8 的 值 ， 然 后 检查 结果 的 符号 位 (最 高 有 效 位 )， 如 图 5-12 所 示 。 如 


果 结 果 是 负 的 ( 即 符号 位 为 1)， 则 4 小 于 B; 否则 ，4 大 于 或 等 于 B。 





A B 
A, 
= po 
A, 
3 
等 于 A 
A 
a) 电路 符号 b ) 实现 A<B 
246 
5-11 4 位 相等 比较 器 图 5-12 N 位 量 值 比较 需 
247 
HDL 例 5.3 给 出 了 不 同 的 比较 操作 。 
HDL 例 5.3 比较 器 
SystemVerilog VHDL 


module comparator #(parameter N= 8) 


(input logic [N-1:0] a, b, 
output logic eq, neq, It, Ite, gt, gte); 


assign eq = (a == b); 
assign neg = (a !=b); 


assign lt = (a <b); 


assign lte= (a <= b); 


assign gt = (a > b); 


assign gte = (a >=b); 


endmodule 


a[7:0] > 
b[7:0] > 





library IEEE; use IEEE.STD_LOGIC_1164.ALL; 


entity comparators is 
generic(N: integer : =8); 
port(a. b: in STD_LOGIC_VECTOR(N-1 downto,.0); 
eq, neq, It, Ite, gt, gte: out STD_LOGIC); 
end; 


architecture synth of comparator is 
begin 


eq <='1' when (a=b) else '0'; 
neq <= '1' when (a /=b) else ‘0’; 
lt <='1' when(a<b) else '0'; 
lte <= '1' when (a <=b) else '0'; 
gt <='1' when (a>b) else '0'; 
gte <= '1' when (a >= b) else '0'; 


end; 


Y 
VO Ve Ve 


图 5-13 综合 后 的 比较 器 


ek 
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5.2.4 算术 逻辑 单元 


算术 逻辑 单元 ( Arithmetic/Logical Unit, ALU) 将 多 种 算术 和 逻辑 运算 组 合 到 一 个 单元 内 。 
例如 ， 典 型 的 算术 逻辑 单元 可 以 执行 加 法 、 减 法 、 量 值 比较 、AND 和 OR 运算 。ALU 是 大 多 数 
计算 机 的 核心 。 

图 5-14 给 出 了 一 个 具有 N 位 输 大 和 位 输出 的 算术 逻辑 单元 的 电路 符号 。 算 术 逻 辑 单元 
接收 说 明 执行 哪个 功能 的 控制 信号 f。 控 制 信和 号 通常 以 灰色 标注 以 便 与 数据 相 区 别 。 表 5-1 列 
出 了 ALU 可 以 执行 的 典型 功能 。SLT 功能 用 作 量 值 比较 ， 将 在 稍 后 讨论 。 


表 5-1 ALU 运算 





图 5-14 算术 逻辑 单元 的 电路 符号 


图 5-15 给 出 了 一 个 算术 逻辑 单元 的 实现 。 该 ALU 包含 一 个 NN 位 加 法 器 和 NN 个 2 输入 AND 
和 OR 门 ; 反 相 器 ; 当 歹 控制 信号 有 效 时 反 转 输入 巨 的 复 A B 
用 器 。4:1 复 用 器 根据 Fs 控制 信号 选择 所 需要 的 功能 。 we 

更 具体 地 说 ，ALU 中 的 算术 和 逻辑 单元 对 4 和 BB 进 
FEA, BB Æ B 或 者 B， 取 决 于 F,, WRF, =00, Wi 
出 复 用 器 就 选择 A AND BB, WEF, =01, WAR HM 
元 就 计算 A OR BB。 如 果 局 。=10， 则 算术 逻辑 单元 就 执 
行 加 法 或 者 减法 。 注 意 ，F, 还 是 加 法 器 的 进位 输入 。 而 且 
在 二 进 制 补 码 计算 中 ,B+1= -B。 如 果 F, =0, WARE 
辑 单元 计算 4 + B。 如 果 ,=1， 则 算术 人 逻辑 单元 计算 4+B 
+1=A-B, 

“4 ,=111 时 ,算术 逻辑 单元 就 执行 小 于 则 置 位 ( Set 
if Less Than，SLT) 操 作 。 当 A<B 时 , Y=1; 否则 ，Y =0。 
换言之 , Y 在 4 小 于 B 时 设置 为 1。 

通过 计算 5 =4 -B ZA SLT, WE 5 是 负数 (也 就 是 
说 ， 符 号 位 为 1)， 则 4 <B。 零 扩展 单元 (zero extend unit) 
通过 将 它 的 1 位 输入 与 高 位 的 0 连接 起 来 产生 N 位 输出 。 ' 





S 的 符号 位 (第 W-1 位 ) 是 零 扩 展 单元 的 输入 。 5-15 NN 位 算术 逻辑 单元 249 
SLT 


为 SLT 操作 配置 一 个 32 位 算术 逻辑 单元 。 假 设 4 =25,,。，B =32,,， 写 出 控制 信号 和 输 
出 了 。 

解 : 因为 4<B， 所 以 了 应 为 1。 在 SLT 中 ,，F,。=111。F, =1， 设 置 加 法 器 单元 为 减法 运算 ， 
输出 S Ay 25,9 — 324) = -7。=111…1001,。 使 用 已 。=11， 最 后 的 复 用 器 将 设置 Y=S;, =1。 < 

有 些 算术 人 逻辑 单元 产生 额外 的 输出 ， 称 作 标志 (flag)。 它 表示 算术 人 逻辑 单元 输出 的 信息 。 
例如 ， 溢 出 标志 说 明 加 法 器 的 结果 有 溢出 。 零 标志 说 明 算 术 逻 辑 单 元 的 输出 是 0。 

N 位 算术 逻辑 单元 的 硬件 描述 语言 设计 留 在 习题 5. 9 中 。 这 个 基本 的 算术 逻辑 单元 有 很 多 
的 变形 来 支持 其 他 功能 ， 如 XOR 或 相等 比较 器 。 
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5.2.5 移 位 器 和 循环 移 位 器 


Ny 


43 Až & ( shifter) 和 循环 移 位 器 (rotator) 用 于 移动 位 并 完成 2 WAN FCHA RR. WA SAT 

移 位 器 根据 指定 的 位 置 数 左 移 或 右 移 二 进 制 数 。 有 多 种 常用 的 移 位 器 : 

e 逻辑 移 位 器 一 一 左 移 (LSL) 或 者 右 移 (LSR) 数 ， 以 0 填充 空位 。 
例如 : 11001 LSR2=00110; 11001 LSL 2 =00100 

e 算术 移 位 器 一 一 与 逻辑 移 位 器 一 样 ， 但 算术 右 移 ( ASR ) 时 会 把 原来 数据 的 最 高 有 效 位 填 
充 在 新 数据 的 最 高 有 效 位 (msb) 上 。 这 对 于 有 符号 数 的 乘法 或 者 除法 很 有 用 (参看 5. 2.6 
节 和 5.2.7 节 )。 算 术 左 移 ( ASL) 与 逻辑 左 移 一 样 。 
例如 : 11001 ASR 2 =11110; 11001 ASL 2 =00100 

© 循环 移 位 器 一 一 循环 移动 数字 ， 这 样 从 一 端 移 走 的 位 重新 填充 到 男 一 端的 空位 上 。 
例如 : 11001 ROR 2 =01110; 11001 ROL 2 =00111 

一 个 入 位 移 位 器 可 以 用 NN 个 NN:1 复 用 器 构成 。 根 据 log, N 位 选择 线 的 值 ， 输 入 从 位 0 移动 


到 位 N-1。 图 5-16 为 4 位移 位 器 的 符号 和 硬件 。 操 作 符 << 、>> 和 >>> 分 别 表示 左 移 、 敢 
辑 右 移 和 算术 右 移 。 根 据 2 位 位 移 量 shamt,。， 输 出 了 为 输入 4 从 位 0 移动 到 位 3。 对 于 所 有 的 
移 位 器 ， 当 shamt,。=00 时 ，Y=4。 习 题 5. 14 包含 了 循环 移 位 器 的 设计 。 


左 移 是 乘法 的 特例 。 左 移 NN 位 相当 于 对 一 个 数 乘 以 2”"。 例 如 ，000011, <<4 =110000, ， 相 


iF 3,, *2° 吉本 


shamt,.. shamt,.o shamt,., 
2 2 2 
4 4 a 4 4 4 
Aso Yz A30 Yo As» Fw 
2 2 





b) ZAE 
图 5-16 4 位移 位 器 
算术 右 移 是 除法 的 特例 。 算 术 右 移 NN 位 相当 于 一 个 数 除 以 2”。 例 如 ，11100, >>>2 = 


111915, #24 = 45/2? = -1) 0 
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5.2.6 乘法 
无 符号 二 进 制 数 的 乘法 和 十 进 制 的 乘法 很 相似 ， 只 不 过 它 只 有 1 和 0。 图 5-17 对 比 了 二 进 








制 数 乘法 和 十 进 制 数 乘法 。 在 这 两 种 情况 下 ， 部 分 积 hers ates 

(partial product) 为 乘 数 的 1 位 乘 以 被 乘 数 的 所 有 位 。 移 x 42 HEAL — X0 

位 这 些 部 分 积 ， 并 将 它们 相 加 就 可 以 得 到 最 后 的 结果 。 na EOR 0101 
总 的 来 说 ，N x N 加 法 器 对 两 个 N 位 数 相 乘 ， 产 生 nd 

一 个 2N 位 的 结果 。 二 进 制 乘法 中 的 部 分 积 要 么 是 被 乘 结果 ~ 0100011 

数 ， 要 么 全 部 为 0。1 位 二 进 制 乘法 相当 于 AND 运算 ， 230x42=9660 5x 7= 35 

所 以 AND 门 电路 用 于 产生 部 分 积 。 a) 十 进 制 b ) 二 进 制 
图 5-18 显示 了 一 个 4 x4 乘法 需 的 电路 符号 、 功 能 图 5-17 乘法 


和 实现 。 乘 法 器 接收 被 乘 数 4 和 乘 数 了， 然后 产生 积 P。 图 5-18b 显示 了 如 何 形成 部 分 积 。 每 
一 个 部 分 积 是 一 个 单独 的 乘 数 位 (B,，B,，B, ，B, ) 与 被 乘 数 的 所 有 位 (4;，4,，4,，4,) 进行 
AND 运算 得 出 的 。 对 于 放 位 运算 数 ， 有 个 部 分 积 和 NN -1 级 的 1 位 加 法 咒 。 例 如 ， 对 于 一 个 
4 x4 的 乘法 器 ， 第 一 行 的 部 分 积 是 B, AND( 4;，4,，4,; ，4u ) 。 这 个 部 分 积 将 与 已 移 位 的 第 二 
个 部 分 积 B, AND(4;，4,，4,;，4,) 相 加 。 随 后 行 的 AND 门 电路 和 加 法 器 产生 其 他 的 部 分 积 ， 
并 将 它们 相 加 。 


A, A, A, Ag 





AB x B, B, B, Bo 
4X4 AB A,B, A,B, AoBo 
x A;B, A,B, A,B, AoB 

A,B, A,B, A,B, AoB, 
8 + 4AB, A,B; A,B, AvB, 
P iy Fe. Fe. tu Te E Fy. Be 

a) 符号 b ) 功能 


5-18 4x4 乘 法 器 


HDL fij 5. 4 是 一 个 乘法 器 的 HDL。 与 加 法 器 一 样 ， 不 同 的 乘法 器 设计 有 不 同 的 速度 和 成 
本 。 综 合 工具 根据 给 定 的 时 间 约 束 选择 最 合适 的 设计 。 


HDL 例 5.4 乘法 器 
SystemVerilog VHDL 


module multiplier #(parameter N= 8) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 
(input logic [N-1:0] a,b, use IEEE.NUMERIC_STD_UNSIGNED.ALL; 
output logic [2*N-1:0] y); 
entity multiplier is 
assign y =a * D; generic(N: integer := 8); 
endmodule port(a, b: in STD_LOGIC_VECTOR(N-1 downto 0); 
y: out STD_LOGIC_VECTOR(2*N-1 downto 0)); 

end; 


architecture synth of multiplier is 
begin 

y <=a*b; 
end; 





图 5-19 综合 后 的 乘法 器 
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5.2.7 除法 - 
对 于 [0，2 ”] 区 间 内 的 N 位 无 符号 数 ， 二 进 制 数 除法 按 以 下 算法 执行 : 


R'=0 

for i=N-1 to 0 
R=(R’ << 1, Ay) 
D=R—B 
ifD<Othen Q 
else Q 

R=R’ 

中 间 余数 ( partial remainder) R 初始 化 为 0。 被 除数 4 的 最 高 有 效 位 成 为 R 的 最 低位 。 中 间 

DU 余数 重复 地 减 去 除数 B， 以 便 判断 它 是 否 满足 条 件 。 如 果 差 D 为 负数 (D 的 符号 位 为 1) ， 则 商 

位 Q, 为 0， 且 忽略 这 个 差 。 否 则 ，@, 为 1， 中间 余数 也 更 新 为 差 D。 在 每 次 循环 中 ， 中 间 余 数 


都 要 乘 以 2( 左 移 了 1 位 ) ，4 的 下 一 个 最 高 有 效 位 成 为 R 的 最 低 有 效 位 ， 这 个 过 程 不 断 重复 。 
结果 满足 条 件 分 = 0+. 


图 5-20 为 一 个 4 位 阵列 除法 器 的 原理 图 。 除 法 器 计算 A/B, PER QO 和 余数 尺 。 图 例 给 出 
了 除法 右 的 电路 符号 和 阵列 中 每 一 个 模块 的 原理 图 。 信 和 号 N 表示 R-B 是 否 为 负数 ， 从 最 该 行 
中 最 左边 单元 的 输出 D 获得 ， 它 是 差 的 符号 位 。 


252 
? 


oe, -w BG È 4 $ 





图 $-20 ”阵列 除法 器 


因为 在 确定 符号 和 复 用 顺 决 定 选择 民 或 者 刀 前 ， 进 位 必须 逐次 地 通过 一 行 中 的 所 有 N K, 
所 以 N 位 除法 器 阵列 的 延迟 按 N 比例 增长 。 除 法 是 一 个 缓慢 的 且 非 常 耗费 硬件 资源 的 运算 ， 
应 尽量 少 地 使 用 它 。 


5.2.8 补充 阅读 


计算 机 算术 可 以 是 一 本 书 的 主题 。Ercegovac 和 Lang 写 的 《Digital Arithmetic》 对 这 个 领域 进 
行 了 非常 精彩 的 介绍 。Weste 和 Harris 写 的 《CMOS VLSI Design》 包 括 了 高 性 能 的 算术 运算 电路 
设计 。 
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5.3 数 制 

计算 机 可 以 对 整数 和 小 数 进行 运算 。 到 目前 为 止 ， 我 们 只 在 1.4 节 中 考虑 了 有 符号 和 无 符 
号 整数 的 表示 。 本 节 将 介绍 定点 和 浮 点 数 ， 它 们 表示 有 理 数 。 定 点 数 与 十 进 制 数 类 似 ， 有 些 位 
表示 整数 部 分 ， 其余 位 表示 小 数 部 分 。 浮 点 数 和 科学 记 数 法 相似 ,包括 尾数 和 阶 码 。 


5. 3.1 定点 数 

定点 表示 法 (fixed-pointnotation) 有 一 个 位 于 整数 和 小 数位 之 间 的 隐 含 的 二 进 制 小 数 点 ， 类 
似 于 通常 在 十 进 制 数 中 整数 和 小 数 之 间 的 十 进 制 小 数 点 。 例 如 ， 图 5-21a 给 出 了 一 个 有 4 个 整 
数位 和 4 个 小 数位 的 定点 数 。 图 5-21b 把 隐 含 的 二 进 制 小 数 点 以 灰色 标识 出 来 ， 图 5-21c 表示 
其 十 进 制 数值 。 

有 符号 定点 数 可 以 用 二 进 制 补 码 或 者 带 符号 的 原 码 表 示 。 图 5-22 给 出 了 -2.375 的 定点 数 
表示 法 ， 其 中 包括 了 4 个 整数 位 和 4 个 小 数位 。 为 了 便于 阅读 ， 隐 含 的 二 进 制 小 数 点 以 灰色 标 
注 出 来 。 在 市 符号 的 原 码 中 ， 最 高 有 效 位 用 于 表示 符号 。 二 进 制 补 码 表示 是 将 数 的 绝对 值 取 
反 ， 然 后 在 最 低 有 效 位 加 1。 在 这 个 例子 中 ， 最 低 有 效 位 的 位 置 在 2 列 。 


a) 01101100 

b) 01 10.1100 0010.0110 1010.0110 , 1101.1010 

c) 22+21+2-1+2-2=6.75 a) 绝对 值 b) 带 符号 的 原 码 。 <) 二 进 制 补 码 
图 5-21 6.75 用 4 个 整数 位 和 4 个 小 数 点 图 5-22 -2.375 的 定点 表示 

位 表示 的 定点 数 


与 所 有 的 二 进 制 数 表 示 一 样 ， 定 点 数 只 是 位 的 集合 。 除 非 给 出 这 些 数 的 解释 ， 否 则 无 法 知 
道 是 否 存在 隐 含 的 二 进 制 小 数 点 。 

定点 数 的 计算 

使 用 定点 数 计算 0.75 + -0. 625, 

解 : 首先 把 第 二 个 数 0. 625 转换 为 定点 二 进 制 表示 。0. 625=2”， 所 以 在 2 列 有 一 个 1， 
剩 下 0. 625 -0.5 =0.125。 因 为 0.125 <2 一 ， 所 以 2 一 列 为 0。 因 为 0.125 三 2 一 ， 所 以 2 一 列 为 1， 剩 下 
0. 125 -0. 125 =0。 因 此 ， 必须 在 2“ 列 有 一 个 0。 把 所 有 的 位 放 在 一 起 ， 得 到 0. 625,, =0000. 1010,。 

为 了 使 加 法 能 正确 进行 ， 需 要 使 用 二 进 制 补 码 表示 有 符号 数 。 图 5-23 给 出 了 - 0. 625 转换 
为 二 进 制 补 码 表 示 的 过 程 。 

图 5-24 给 出 了 二 进 制定 点 数 加 法 和 与 十 进 制 加 法 的 比较 。 注 意 ， 结 果 忽 略 了 图 5-24a 的 二 
进 制定 点 加 法 中 的 首位 1。 


0000.1010 ”二进制 原 码 





0000.1100 0.75 
1111.0101 ZMU + 1111.0110 + (-0.625) 
HaT E LI 10000.0010 0.125 
1111.0110 二 进 制 补 码 a) 二 进 制 定点 数 加 法 b ) 等 价 的 十 进 制 加 法 
图 5-23 ”和 定点 数 的 二 进 制 补 码 转换 图 5-24 加 法 < 
5.3.2 JAM” 


浮 点 数 与 科学 记 数 法 相似 。 它 解决 了 整数 和 小 数位 长 度 固 定 的 限制 ， 允 许 表示 一 个 非常 大 
或 者 非常 小 的 数 。 与 科学 记 数 法 一 样 ， 浮 点 数 包 含 符 号 (sign) 、 尾 数 
(mantissa，M) ， 基 数 (base，B) 和 阶 码 (exponent, E), af 5-25 所 示 。 
例如 ， 数 字 4. 1 x 10 是 十 进 制 数 4100 的 科学 计数 法 。 它 的 尾数 为 4.1， 图 5-25 浮 点 数 


255 
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基数 为 10 ， 阶 码 为 3。 十 进 制 小 数 点 移动 到 最 高 有 效 位 的 后 面 。 二 进 制 浮 点 数 的 基数 为 2， 包 
含 二 进 制 尾 数 。 在 32 位 浮 点 数 中 用 1 位 表示 符号 ，8 位 表示 阶 码 ，23 位 表示 尾数 。 

32 位 浮 点 数 

表示 十 进 制 数 228 的 浮 点 数 。 

解 : 首先 将 十 进 制 数 转换 为 二 进 制 数 : 228,, =11100100, =1. 11001 x2 。 图 5-26 给 出 了 它 
的 32 位 编码 (后 面 将 进一步 修改 以 便 提 高 效率 ) 。 其 中 符号 位 为 正 (0) ，8 MEMRI, W 
下 的 23 位 为 尾数 。 


位 二 ， ei 23 位 
0| 00000111 | 111 0010 0000 0000 0000 0000 
符号 THY 尾数 


5-26 32 位 浮 点 数 表示 一 一 版 本 1 < 


在 二 进 制 浮 点 数 中 ， 尾 数 的 第 一 位 (二 进 制 小 数 点 的 左 端 ) 总 是 为 1， 因 此 不 需要 存储 它 。 
它 称 为 隐 含 前导 1(implicit leading one) 。 图 5-27 显示 了 修改 后 的 浮 点 数 228,, = 11100100, x 2” 
=1. 11001 x2 。 因 为 效率 的 关系 ， 所 以 隐 含 前 导 1 没有 包含 在 23 位 的 尾数 中 。 只 存储 小 数 部 
分 的 位 。 这 为 有 用 的 数据 节省 了 一 位 。 





1 位 8 位 23 位 
EF 00000111 | 110 0100 0000 0000 0000 0000 
符号 。 阶 码 尾数 





图 5-27 32 位 浮 点 数 表示 一 一 版 本 2 


我 们 对 阶 码 字段 再 做 一 次 修改 。 阶 码 需 要 表示 正 数 和 负数 阶 码 。 为 了 做 到 这 点 ， 浮 点 数 使 
用 了 偏 置 (biased ) 阶 码 。 它 是 原始 阶 码 加 上 一 个 常数 偏 置 。32 位 浮 点 数 使 用 的 偏 置 是 127。 例 
如 ， 对 于 阶 码 7， 偏 置 阶 码 就 是 7 +127 = 134 = 10000110, 。 对 于 阶 码 -=4， 偏 置 阶 码 就 是 -4+ 
127 =123 =01111011,。 图 5-28 给 出 了 1.11001, x27 的 浮 点 表示 ， 其 中 采用 了 隐 含 前 导 1 和 偏 
置 阶 码 134(7 + 127 ) 。 这 种 表示 方法 符合 IEEE 754 浮 点 数 标准 。 


1 位 8 位 23 位 
O| 10000110 | 110 0100 0000 0000 0000 0000 
符号 ” 偏 置 阶 码 尾数 


图 5-28 IEEE 754 浮 点 数 表示 法 


P 特殊 情况 : 0, +œ 和 NaN 

IEEE 浮 点 数 标准 用 特殊 方式 表示 0、 无 穷 大 和 非法 结果 等 数 。 例 如 ， 因 为 隐 含 前 导 1， 所 
以 在 浮 点 数 表 示 中 表示 数字 0 就 存在 问题 。 可 以 采用 全 0 和 全 1 填充 阶 码 来 解决 这 些 特殊 情 
况 。 表 5-2 PANTO, +o Ml NNW RAN. 与 带 符 号 的 原 码 一 样 ， 浮 点 数 也 有 正 0 和 负 
0。NaN 用 于 表示 不 存在 的 数 ， 如 V - 1 或 log,( -5)。 


表 5-2 IEEE 754 3X70, +œ 和 NaN 的 浮 点 数 表示 


数字 符号 阶 码 小 数 

0 X 00000000 00000000000000000000000 
00 0 11111111 (00000000000000000000000 
— om 1 11111111 00000000000000000000000 
NaN X 11111111 非 零 


KF BHR 


2. 单 精 度 和 双 精 度 格 式 
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到 目前 为 止 ， 我 们 已 经 讨论 了 32 位 浮 点 数 。 这 种 格式 称 为 单 精度 浮 点 数 ( signle- precision, 
single 或 float), IEEE 754 标准 还 定义 了 64 位 双 精 度 浮 点 ( double-precision、double) 以 便 提 供 更 
高 的 精度 和 更 大 的 取 值 范围 。 表 5-3 显示 了 每 种 格式 的 字段 位 数 。 


格式 总 位 数 
单 精度 浮 点 数 32 
双 精 度 浮 点 数 64 


表 5-3 
符号 位 数 阶 码 位 数 小 数位 数 


l 
] 


Co 


23 
l 52 


一 


排除 前 面 提 到 的 特殊 情况 ， 正常 的 单 精度 数 的 取 值 范围 是 +1.175 494 x10™ ~ +3. 402 824 x 
10”。 它 们 有 7 位 有 效 的 十 进 制 数字 (因为 2 =10”)。 类 似 地 ， 正 常 的 双 精 度数 的 取 值 范围 为 
+2. 225 073 858 507 20 x 10 ~ + 上 1.797 693 134 862 32 x 10”， 精 度 为 15 位 有 效 十 进 制 数字 。 


3. BA 


TEA BOF Eh AREA BU i VA BU ARS: 1) 向 上 舍 ; 2) 向 下 
&; 3) 向 零售; 4) mere BAAS ABS Ie) a o TE Um A RSP, AN 
果 两 端的 距离 一 样 ， 则 选择 小 数 部 分 最 低 有 效 位 为 0 的 那个 数 。 

当 一 个 数 的 数值 部 分 太 大 而 不 能 表示 时 ， 会 产生 上 溢 。 同 样 ， 当 一 个 数 太 小 时 ， 会 产生 下 
溢 。 在 回 最 近 端 舍 人 的 模式 中 ， 上 海 会 被 加 上 舍 为 上 o ， 下 洲 则 向 下 侈 为 0。 


4. 浮 点 数 加 法 


浮 点 数 加 法 并 不 像 二 进 制 补 码 加 法 那么 简单 。 同 符号 的 浮 点 数 加 法 的 步骤 如 下 : 


1) 提取 阶 码 和 小 数位 。 

2) 加 上 前 导 1， 形 成 尾数 。 

3) 比较 阶 码 。 

4) 如 果 需 要 ， 对 较 小 的 尾数 移 位 。 

5) 尾数 相 加 。 

6) 规范 化 尾数 ， 并 在 需要 时 调整 阶 码 。 

7) SAAR. 

8) 把 阶 码 和 小 数组 合成 浮 点 数 。 

图 5-29 给 出 了 7.875(1.111 11 *27) 
与 0.1875(1.1x2”) 的 浮 点 数 加 法 。 结 果 
为 8. 0625 ( 1. 000 000 1 x 2 ) 。 在 第 一 步 
(提取 阶 码 和 小 数 部 分 ) 和 第 二 步 ( 加 上 隐 
含 前 导 1) 后 ， 采 用 较 大 阶 码 减 去 较 小 阶 码 
的 方式 比较 阶 码 字段 。 减 法 得 出 的 结果 就 
是 第 四 步 中 右 移 较 小 的 数 来 对 齐 二 进 制 小 
数 点 的 位 数 (使 两 者 的 阶 码 相等 )。 对 齐 后 
的 数 相 加 。 如 果 相 加 得 到 的 和 的 尾数 大 于 
或 等 于 2.0， 则 需要 结果 右 移 一 位 以 便 规 
范 化 ， 并 在 阶 码 中 加 1。 在 这 个 例子 中 ， 
结果 是 准确 的 ， 所 以 不 需要 舍 人 。 结 果 在 
去 掉 隐 含 前 导 1 并 加 上 符号 位 后 ， 以 浮 点 
数 格式 存储 。 


浮 点 数 
o| 01111100 | 100 0000 0000 0000 0000 0000 | 
阶 码 小 数 
O000001 
my 
iii 
-Cd 
101 ( 移 位 数 ) 
— 0.000 0110 0000 0000 0000 0000] 00000 
*5%  [To000001] , [0.000 0110 0000 0000 0000 0000 
10.000 0010 0000 0000 0000 0000 


第 6 步 10000001} 10.000 0010 0000 0000 0000 0000 >> 1 


+ l 
10000010] [1.000 0001 0000 0000 0000 0000 
第 7 步 (无 需 舍 入 ) 
第 8 步 |0 | 10000010 | 000 0001 0000 0000 0000 0000 
5-29 AOMA 
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5.4 时 序 电 路 模块 


本 节 将 介绍 计数 器 和 移 位 寄存 器 这 两 
种 时 序 电 路 模块 。 


5.4.1 计数 器 


图 5-30 中 的 N 位 二 进 制 计数 器 (binary counter) 包 含 市 有 时 钟 和 复位 输入 、N 位 输出 Q 的 
时 序 算术 电路 。 复 位 ( Reset) 将 输出 初始 化 为 0。 然 后 ,计数器 在 每 个 时 钟 的 上 升 沿 递增 1， 以 
二 进 制 顺序 输出 所 有 2 种 可 能 的 值 。 

图 5-31 给 出 了 一 个 由 加 法 器 和 复位 寄存 需 构 成 的 N 位 计数 器 。 在 每 一 个 周期 ， 计 数 怖 对 
存储 在 寄存 器 中 的 值 加 1。HDL 例 5.5 描述 了 一 个 异步 复位 二 进 制 计数 器 。 


| he. 





复位 
图 5-30 计数 器 的 电路 符号 图 5-31 入 位 计数 器 
HDL 例 5.5 计数 器 
SystemVerilog VHDL 
module counter #(parameter N = 8) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 
(input logic clk, use TEEE.NUMERIC_STD_UNSIGNED.ALL; 
input logic reset, 
output logic [N-1:0] q); entity counter is 
generic(N: integer :=8); 
always_ff @(posedge clk, posedge reset) port(clk, reset: in STD_LOGIC;: 
if (reset) q<=0; q: out STD_LOGIC_VECTOR(N-1 downto 0)); 
else q <=q+1; end; 
endmodule 
architecture synth of counter is 
begin 
process(clk, reset) begin 
if reset then q <= (OTHERS => '0'); 
elsif rising_edge(clk) then q <=q+'l'; 
end if; 
end process; 
end; 


D[7:0] Q[7:0] 
R 


图 5-32 综合 后 的 计数 器 





其 他 类 型 的 计数 器 (如 ，UP/DOWN 计数 器 ) 将 在 习题 3. 43 到 习题 5.46 中 讨论 。 


5.4.2 移 位 寄存 器 


移 位 寄存 器 (shift register) 包 括 时 钟 、 串 行 输入 S。、 串 行 输出 Soa 和 位 并 行 输出 Qy 1.0, 
如 图 5-33 所 示 。 在 时 钟 的 每 一 个 上 升 沿 ， 从 Su 移 人 一 个 新 的 位 ， 所 有 后 续 内 容 都 向 前 移动 。 
移 位 寄存 器 的 最 后 一 位 在 5S,, 中 。 移 位 寄存 器 可 以 看 作 串 行 到 并 行 转换 器 。 输 入 由 5;, 以 串 行 方 
式 提供 (一 次 一 位 )。 在 入 个 周 其 后， 前 面 的 NN 位 输入 可 以 在 O 中 并 行 访问 。 
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AN AS FE RE AT VA ON fh ac a BT A, AP 5-34 所 示 。 有 些 移 位 寄存 器 还 有 初始 化 所 
有 触发 器 的 复位 信号。 


Sin eco Sut 





O A Q Qy- 
RI 5-33 ” 移 位 寄存 器 的 电路 符号 图 5-34 移 位 寄存 器 的 电路 原理 图 
一 个 相关 的 电路 是 并 行 到 串 行 (parrallel-to- serial) 转换 器 。 它 并 行 加 载 V 位 ， 然 后 一 次 移 
出 一 位 。 如 图 5-35 所 示 ， 增 加 并 行 输入 忆 ，，。 和 控制 信号 Load( 加 载 ) 后 ， 移 位 寄存 器 可 以 修 
改 为 既 可 执行 串 行 到 并 行 操作 ， 也 可 执行 并 行 到 串 行 操作 。Load 信号 有 效 时 ， 触 发 侨 从 输入 D 
中 并 行 加 载 数据 。 否 则 ， 移 位 寄存 器 就 正常 移 位 。HDL 例 5. 6 描述 了 这 样 的 移 位 寄存 器 。 





图 5-35 ” 带 并 行 加 载 的 移 位 寄存 需 
HDL 例 5.6 带 并 行 加 载 的 移 位 寄存 器 


SystemVerilog VHDL 
module shiftreg #(parameter N= 8) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 
(input logic CIK. 
input logic reset, load. entity shiftreg is 
input logic sin, generic(N: integer := 8); 
input logic [N-1:0] d, port(clk, reset: in STD_LOGIC; 
output logic [N-1:0] q, load, sin: in STD_LOGIC; 
output logic sout): d: in STD_LOGIC_VECTOR(N-1 downto 0); 
q: out STD_LOGIC_VECTOR(N-1 downto 0); 
always_ff @(posedge clk, posedge reset) sout: out STD_LOGIC); 
if (reset) q <= 0; end; 
elseif (load) q<=d; 
else q <= {q[N-2:0], sin}; architecture synth of shiftreg is 
begin 
assign sout = q[N-1]:; process(clk, reset) begin 
endmodule if reset='1' then q <= (OTHERS => '0'); 
elsif rising_edge(clik) then 
if load then q <=d; 
else q <= q(N-2 downto 0) & sin; 
end if; 
end if; 


end process; 


sout <=q(N-1); 
end; 





图 5-36 ”综合 后 的 移 位 寄存 器 
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扫描 链 ” 

通过 扫描 链 (scan chain) 技术， 移 位 寄存 器 经 常用 于 测试 时 序 电 路 。 测 试 组 合 电路 相对 直 
观 。 应 用 称 为 测试 向 量 (test vector) 的 已 知 输入 ， 将 输出 与 期 待 值 比较 。 因 为 时 序 电 路 有 状态 ， 
所 以 测试 要 困难 一 些 。 一 个 已 知 的 初始 状态 开始 ， 可 能 需要 许多 周期 的 测试 向 量 才 能 使 电路 进 
入 期 望 的 状态 。 例 如 ， 测试 32 位 计数 器 的 最 高 有 效 位 从 0 到 1 的 变化 ， 需 要 复位 计数 器 ， 然 
后 应 用 2 (大 约 200 万 个 ) 时 钟 脉冲 ! 

为 了 解决 这 个 问题 ,设计 者 希望 可 以 直接 地 观察 和 控制 有 限 状 态 机 的 所 有 状态 。 这 可 以 通 
过 增加 一 个 测试 模式 来 实现 。 在 此 模式 下 ， 所 有 触发 器 的 内 容 可 以 读 出 或 者 加 载 所 需要 的 值 。 
大 多 数 系统 有 太 多 的 触发 器 ， 以 至 于 不 能 为 每 个 触发 器 分 配 一 个 管 脚 来 完成 其 读 写 。 相 反 ， 系 
统 中 所 有 的 触发 带 都 连接 在 一 个 称 为 扫描 链 的 移 位 寄存 器 中 。 在 正常 模式 下 ， 触 发 器 从 刀 输 入 
读 和 数据， 忽略 扫描 链 。 在 测试 模式 下 ， 触 发 器 用 5S;, 和 5,, 串 行 地 移出 它们 的 内 容 或 移入 新 的 
内 容 。 加 载 复 用 需 稼 稼 集成 在 触发 器 中 ， 构 成 一 个 可 扫描 触发 器 (scanable flip-flop)。 图 5-37 
为 可 扫描 触发 顺 的 原理 图 和 电路 符号 ， 并 说 明 这 些 触发 器 如 何 级 联 以 便 构成 一 个 NV 位 可 扫描 寄 
FF fit o | 





ot Qs 2 Q, Qy- 
a) 原理 图 b) 电路 符号 c) N 位 可 扫描 寄存 器 
图 5-37 可 扫描 触发 器 
例如 ， 在 测试 32 位 计数 器 时 ， 可 以 在 测试 模式 下 移入 011111…111,， 在 正常 模式 下 累加 一 
个 周期 ， 然 后 移出 结果 ( 此 结果 应 为 1000…000)。 这 只 需要 32 +1 +32 =65 个 周期 。 


5.5 存储 器 阵列 


前 面 的 各 节 介 绍 了 用 于 操作 数据 的 算术 和 时 序 电 路 。 数 字 系 统 还 需要 存储 器 ( memory ) HK 
存储 电路 使 用 过 的 数据 和 生成 的 数据 。 用 触发 器 组 成 的 寄存 器 是 一 种 存储 少量 数据 的 存储 器 。 
本 节 将 介绍 可 以 有 效 存 储 大 量 数据 的 存储 器 阵列 (memory array) 。 

本 节 将 首先 概述 所 有 存储 器 阵列 的 一 般 特 性 。 然 后 介绍 3 种 类 型 的 存储 器 阵列 : 动态 随机 
访问 存储 器 (DRAM) 、 静 态 随 机 访问 存储 器 (SRAM) 和 只 读 存 储 器 (ROM) 。 每 一 种 存储 器 以 不 
同 的 方式 存储 数据 。 本 节 还 将 简要 讨论 面积 和 延迟 的 折 中 ， 并 说 明 使 用 存储 器 阵列 不 仅 可 以 存 
储 数 据 ， 还 可 以 执行 一 些 逻 辑 功能 。 最 后 讨论 存储 器 阵列 的 HDL 代码 。 


5.5.1 概述 


图 5-38 是 存储 器 阵列 的 通用 电路 符号 。 存 储 器 由 一 个 二 维 存储 器 单元 阵列 构成 。 存 储 器 
可 以 读 取 或 者 写 入 内 容 到 阵列 的 一 行 。 这 行 由 地 址 (address) 指 定 。 读 出 或 者 写 人 的 值 称 为 数据 
(data) 。 一 个 有 WN 位 地 址 和 M 位 数据 的 阵列 有 2 行 和 以 列 。 每 行 数据 称 为 一 个 字 (word)。 因 
此 ， 阵 列 包 含 了 2 个 M 位 字 。 

图 5-39 是 一 个 有 2 位 地 址 和 3 位 数据 的 存储 器 阵列 。2 位 地 址 指明 阵列 中 4 行 的 一 行 ( 数 
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据 字 ) 。 每 一 个 数据 字 有 3 位 宽 。 图 5-39b 显示 了 存储 器 阵列 中 的 可 能 内 容 。 

阵列 的 深度 (depth ) 是 行 数 ， 宽 度 (width) 是 列 数 ， 也 称 为 字 大 小 。 阵 列 的 大 小 就 是 深度 x 
宽度 。 图 5-39 为 一 个 4 F x3 位 的 阵列 ， 简 称 为 4 x3 阵列 。1024 F x32 位 阵列 的 符号 如 
图 5-40 所 示 。 此 阵列 的 总 大 小 为 32Kb。 





地 址 数据 
mre er == E 
地 址 阵列 | 10 
3 00 [ojiji 
M 数据 宽度 
数据 a) 电路 符号 b) 功能 
5-38 通用 存储 器 阵列 的 5-39 4x3 存储 器 阵列 图 5$-40 32Kb 阵列 : 深度 =2” = 
电路 符号 1024 字 ， 宽 度 =32 位 


1. 位 单元 

存储 器 阵列 由 位 单元 (bit cell) 的 阵列 组 成 ， 其 中 每 个 位 单元 存储 1 位 数据 。 图 5-41 说 明 每 
一 个 位 单元 与 一 个 字 线 (wordline) 和 一 个 位 线 (bitline) 相连。 对 于 每 一 个 地 位 线 
址 位 的 组 合 ， 存 储 器 将 字 线 设置 为 高 电 平 ， 并 激活 此 行 中 的 位 单元 。 当 字 pe 
线 为 高 电 平时 ， 就 从 位 线 传 出 或 传人 要 存储 的 位 。 否 则 ， 位 线 就 与 位 单元 
断 开 。 存 储 位 的 电路 因 存储 器 类 型 的 不 同 而 不 同 。 

为 了 读 位 单元 ， 位 线 初始 化 为 浮 空 (Z) 。 然 后 ， 字 线 打开 为 高 电 平 ， 允 许 ” 图 5-41 “位 单元 
存储 的 值 驱动 位 线 为 0 或 者 1。 为 了 写 位 单元 ,位 线 强 制 驱动 为 期 望 要 的 值 。 然 后 ， 字 线 打开 为 
高 电 平 ， 将 位 线 连接 存储 位 。 强 制 驱 动 使 的 位 线 将 改写 位 单元 的 内 容 ， 将 期 望 的 值 写 人 存储 位 。 

2， 存 储 器 的 结构 

5-42 为 4x3 存储 器 阵列 的 内 部 结构 。 当 然 ， 实际 的 存储 器 会 更 大 ， 但 大 型 阵列 的 行为 
与 小 型 阵列 相似 。 在 这 个 例子 中 ， 阵 列 存储 图 5-39b 中 的 数据 。 

在 读 存储 器 时 ， 一 条 字 线 设 为 高 电 平 ， 位 单元 的 相应 行 驱动 位 线 为 高 电 平 或 者 低 电 平 。 在 
写 存 储 器 时 ， 首 先 将 位 线 驱 动 为 高 电 平 或 者 低 电 平 ， 然 后 字 线 设置 为 高 电 平 ， 允 许 位 线 的 值 在 
储 到 位 单元 的 相应 行 中 。 例 如 ， 为 了 读 地 址 10， 位 线 首先 浮 空 ， 译 码 器 设置 位 线 2 为 高 电 平 ， 
位 单元 (100) 的 那 行 中 存储 的 数据 100 被 读 出 到 数据 位 线 。 为 了 写 值 001 到 地 址 1L， 位 线 首先 
被 驱动 到 值 001 ， 然 后 字 线 3 被 设置 为 高 电 平 ， 新 值 (001) 就 被 存储 到 位 单元 中 。 
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3. 存储 器 端口 

所 有 存储 器 都 有 一 个 或 者 多 个 端口 (port)。 每 一 个 端口 提供 对 一 个 存储 器 地 址 的 读 / 写 访 
问 。 前 面 的 例子 都 是 单 端 口 存储 器 。 

% 3m 2 ( multiported ) 存储 锅 可 以 同时 访问 多 个 地 址 。 图 5-43 是 一 
个 3 端口 存储 器 ， 其 中 有 两 个 读 端 口 和 一 个 写 端 口 。 端 口 1 从 地 址 Al 
读 出 数据 放 到 读数 据 输 出 RD1 ， 端 口 2 从 地 址 A2 读数 据 放 到 RD2 。 
如 果 写 使 能 WES 有 效 时 ， 那么 在 时 钟 的 上 升 沿 端口 3 将 来 自 写 数据 输 
A WD3 的 数据 写 到 地 址 A3 中 。 图 5-43 3 端口 存储 器 

4. 存储 器 类 型 

存储 器 阵列 通过 容量 (深度 x 宽度 ) 、 端 口 的 数目 和 类 型 来 描述 。 所 有 的 存储 器 阵列 都 以 
位 单元 的 阵列 来 存储 数据 ， 但 是 在 如 何 存储 上 它们 却 各 有 不 同 。 

存储 器 可 以 根据 它们 如 何在 位 单元 上 存储 位 来 分 类 。 最 广泛 的 分 类 是 随机 访问 存储 器 
(Random Access Memory, RAM) 和 只 读 存 储 器 (Read Only Memory, ROM). RAM 是 易 失 的 (vol- 
atile) ， 即 当 关 掉 电 源 时 它 就 会 丢失 数据 。ROM 是 非 易 失 的 (non-volatile) ， 即 便 没 有 电源 它 也 
可 以 无 期 限 地 保存 数据 。 

因为 一 些 历 史 的 原因 RAM 和 ROM 获得 现在 的 名 字 , 但 是 现在 也 不 再 有 意义 了 。RAM 称 
为 随机 访问 存储 器 ， 因 为 访问 任何 数据 字 的 延迟 都 相同 。 相 反 ， 顺 序 访问 存储 器 (如 磁带 ) 获 
得 临近 数据 会 比 获得 相距 较 远 的 数据 ( 如 磁带 男 一 端的 数据 ) 更 快 。ROM 称 为 只 读 存 储 器 ， 因 
为 在 历史 上 它 只 能 读 ， 而 不 能 被 写 人 。 这 些 名 字 容 易 让 人 混淆 ， 因 为 ROM 也 是 随机 访问 的 。 
更 糟糕 的 是 ， 大 多 数 现代 ROM 即 可 以 读 也 可 以 写 。RAM 和 ROM 的 最 重要 区 别 是 : RAM EY, 
失 的 ，ROM 是 非 易 失 的 。 

RAM 的 两 种 主要 类 型 包括 : 动态 RAM (Dynamic RAM，DRAM) 和 静态 RAM (Static RAM, 
SRAM). JA RAM 以 电容 充 放电 来 存储 数据 ， 静 态 RAM 使 用 交叉 耦合 的 反 向 器 对 来 存储 数 
据 。 对 于 ROM ,根据 擦 写 方式 的 不 同 有 很 多 不 同 的 类 型 。 这 些 不 同类 型 的 存储 器 将 在 后 面 各 
节 中 讨论 。 


5. 5.2 动态 随机 访问 存储 器 
动态 随机 访问 存储 器 (Dynamic RAM, DRAM) 以 电容 的 充电 和 放电 来 存储 位 。 图 5-44 显示 
了 一 个 DRAM 位 单元 。 位 值 存储 在 电容 中 。nMOS 晶体 管 作为 开关 ， 决 定 是 不 是 从 位 线 连接 电 
容 。 当 字 线 有 效 时 ，nMOS 唱 体 管 为 导 通 状态 ， 存 储 位 的 值 就 可 以 在 位 线 上 传人 和 传 出 。 
如 图 5-45a 所 示 ， 当 电容 充电 到 oo 时， 存储 位 为 1; 当 放电 到 CND 时 ( 见 图 5-45b) 存 储 位 
为 0。 电 容 结 点 是 动态 的 ， 因 为 它 不 由 连接 到 VRA COND 的 晶体 管 驱动 为 高 电 平 或 者 低 电 平 。 








位 线 位 线 
位 线 字 线 
字 线 
存储 ++ 
存储 位 T H =P I. 
a) b) 
K| 5-44 DRAM 位 单元 图 5-45 DRAM 存储 值 


当 读 时 ， 数 据 值 从 电容 传送 到 位 线 。 当 写 时 ， 数据 值 从 位 线 传送 到 电容 。 读 破坏 存储 在 电 
容 中 的 位 值 ， 所 以 在 每 次 读 后 需 要 恢复 ( 重 写 ) 数 据 。 即 使 当 DRAM 没有 被 读 时 ,电容 的 电压 
也 会 慢 慢 泄漏 ， 其 内 容 也 必须 在 几 毫 秒 内 刷新 ( 读 ， 然 后 重 写 )。 
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5.5.3 静态 随机 访问 存储 器 


静态 随机 访问 存储 器 (static RAM，SRAM ) 称 为 静态 的 ， 因 为 不 需要 刷新 存储 位 。 图 5-46 
是 一 个 SRAM 位 单元 。 数 据 位 存储 在 3. 2 节 中 所 描述 的 交叉 耦合 反 存储 位 
相 器 中 。 每 个 单元 有 两 个 输出 位 线 和 位 线 。 当 字 线 有 效 时 ， 两 个 ik 位 线 
nMOS 晶体 管 都 打开 ， 数 据 值 就 从 位 线 上 传 出 /传人 。 与 DRAM 不 
同 ， 如 果 噪 声 减 弱 了 存储 位 的 值 ， 则 交叉 耦合 反 相 器 将 恢复 存 
储 值 。 图 5-46 SRAM 位 单元 


5. 5.4 面积 和 延迟 


触发 器 、SRAM 和 DRAM 都 是 易 失 的 存储 器 ， 但 是 它们 每 个 有 不 同 的 面积 和 延迟 特性 。 
表 5-4 比 较 了 这 3 种 易 失 的 存储 器 。 对 于 触发 器 ， 可 以 通过 其 输出 直接 访问 存储 的 数据 ， 但 它 
至 少 需 要 20 个 晶体 管 来 构成 。 总 的 来 说 ， 唱 体 管 数 越 多 的 器 件 ， 世 片面 积 、 功 耗 和 成 本 也 更 
高 。DRAM 延迟 比 SRAM 延迟 更 长 ， 因 为 它 的 位 线 不 是 用 晶体 管 驱动 的 。DRAM 必须 等 待 充 
电 ， 从 电容 将 值 移动 到 位 线 的 速度 较 慢 。DRAM 的 吞吐 量 基本 上 也 比 SRAM 的 低 ， 因 为 它 必须 
周期 性 地 在 读 取 之 后 进行 刷新 。 已 经 开发 出 新 的 DRAM 技术 ， 如 同步 DRAM( SDRAM) ) 和 双 倍 
数据 速率 (DDR)SDRAM， 用 于 克服 上 述 问 题 。SDRAM 使 用 一 个 时 钟 使 存储 器 访问 流水 线 化 。 
DDR SDRAM， 有 时 简称 为 DDR， 同 时 使 用 时 钟 的 上 升 沿 和 下 降 沿 来 存 取 数 据 ， 因 此 在 给 定 的 
时 钟 速率 可 以 获得 双 倍 吞吐 量 。DDR 在 2000 年 首次 标准 化 ， 当 时 的 访问 速率 为 100 ~200MHz。 
后 来 的 标准 ，DDR2 、DDR3 、DDR4 等 ， 提 高 了 时 钟 速 率 ，2012 年 速率 超过 1CHz。 








表 5-4 存储 器 比较 
存储 器 类 型 每 个 位 单元 的 晶体 管 数 延迟 
触发 器 ~20 快 
SRAM 6 中 等 
DRAM 1 慢 


存储 器 延迟 和 吞吐 量 也 与 存储 器 大 小 有 关 。 在 其 他 条 件 相同 的 情况 下 ， 大 容量 存储 器 一 般 
比 小 容量 存储 器 更 慢 。 对 于 特定 设计 ， 最 好 的 存储 器 选择 依赖 于 其 速度 、 成 本 和 功 耗 约束 。 


5. 5.5 寄存 器 文件 
数字 系统 通常 使 用 一 组 寄存 器 来 存储 临时 变量 。 这 组 寄存 器 称 为 寄存 器 文件 (register file) , 
它 通 常 由 小 型 多 端口 SRAM 阵列 组 成 ， 因 为 它 比 触 发 器 阵列 更 紧凑 。 CLK 


图 5-47 是 一 个 32 寄存 器 x 32 位 的 3 端口 寄存 器 文件 ， 它 由 与 
图 5-43 相似 的 3 端口 存储 器 组 成 。 寄 存 器 文件 有 两 个 读 端 口 (Al/ 
RD1 和 A2/RD2) 和 一 个 写 端口 (A3/WD3)。 地 址 线 AL、A2 和 A3 均 
为 5 位 ， 它 们 可 以 访问 所 有 的 2 = 32 个 寄存 器 。 因 此 ， 可 以 同时 读 





两 个 寄存 器 和 写 一 个 寄存 髓 。 图 5-47 有 两 个 读 端口 和 一 
个 写 端 口 的 32 x32 
5.5.6 只 读 存 储 器 寄存 器 文件 


只 读 存 储 器 ( Read Only Memory, ROM) 以 唱 体 管 的 存在 与 否 来 存储 一 位 。 图 5-48 是 一 个 简 
单 的 ROM 位 单元 。 为 了 读 这 个 单元 ， 位 线 被 缓慢 地 拉 至 高 电 平 。 随 后 打开 字 线 。 如 果品 体 管 
存在 ， 它 将 使 位 线 为 低 电 平 。 如 果 它 不 存在 ， 位 线 将 保持 高 电 平 。 注 意 ，ROM 的 位 单元 是 组 
合 电 路 ， 在 电源 关闭 的 情况 下 没有 可 以 “忘记 ”的 状态 。 
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ROM 的 内 容 可 以 用 点 表示 法 来 描述 。 在 图 5-49 中 ， 用 点 表示 法 描述 了 包含 图 5-39 中 数据 
的 4 字 x3 位 ROM, 在 行 ( 字 线 ) 和 列 (位 线 ) 交 叉 的 点 表示 此 数据 位 为 1。 例 如 ， 顶 端 字 线 在 数 
据 '; 上 有 一 个 点 ， 所 以 地 址 11 中 存储 的 数据 字 为 010。 

位 线 
字 线 


存储 0 的 
位 单元 


位 线 
FR 


存储 1 的 
位 单元 





数据 2 数据 1 数据 0 
图 5-48 包含 0 和 1 的 ROM 位 单元 图 5-49 4x3 的 ROM: 点 表示 法 


理论 上 ，ROM 可 以 由 一 组 AND 门 后 跟 一 组 OR 门 的 2 级 逻辑 组 成 。AND 门 产生 所 有 可 能 
的 最 小 项 ， 从 而 形成 一 个 译 码 器 。 图 5-50 显示 了 用 译 码 器 和 OR 门 组 成 图 5-49 的 ROM, 在 
图 5-49 中 每 个 有 点 的 行 就 是 图 5-50 中 的 OR 门 的 输入 。 对 于 只 有 一 个 点 的 数据 位 (如 数据 , ) , 
就 不 需要 OR 门 。 这 种 ROM 的 表示 方式 很 有 趣 ， 因 为 它 说 明了 ROM 如 何 执行 任意 两 级 逻辑 功 
能 。 在 实践 中 ，ROM 用 晶体 管 而 不 是 逻辑 门 构成 ， 这 样 可 以 节省 面积 和 成 本 。5. 6. 3 节 将 深入 
探讨 晶体 管 级 实现 。 

在 制造 时 ， 图 5-48 中 的 ROM 位 单元 的 内 容 可 以 用 每 个 位 单元 中 的 晶体 管 的 有 无 来 确定 。 
可 编程 ROM(Programable ROM，PROM ) 在 每 一 个 位 单元 都 放置 一 个 晶体 管 ， 然 后 提供 方法 决 
定 唱 体 管 是 否 接地 。 

图 5-51 为 熔 丝 烧 断 可 编程 ROM(fuse-programable ROM) 的 位 单元 。 使 用 者 通过 应 用 高 电压 
有 选择 地 熔断 熔 丝 来 对 ROM 编程 。 如 果 熔 丝 存在 ， 则 晶体 管 接 地 ， 单 元 保持 0。 如 果 熔 丝 熔 
断 ， 晶 体 管 就 与 地 断 开 ， 单 元 保持 1。 因 为 熔 丝 熔断 后 就 不 能 恢复 ， 所 以 它 也 称 为 一 次 可 编 
f= ROM, 





位 线 
字 线 
地 址 地 
未 熔断 
熔 丝 
存储 0 的 位 单元 
位 线 
字 线 
已 熔断 
熔 丝 s 
存储 1 的 位 单元 
.图 5-50 ”使 用 门 的 4x3 ROM 实现 图 5-51 熔 丝 熔断 可 编程 ROM 的 位 单元 


可 重复 编程 ROM 提供 一 种 可 修改 机 制 来 确定 晶体 管 是 否 连接 地 。 可 擦 除 PROM (Erasable 
PROM，EPROM) 把 nMOS 晶体 管 和 熔 丝 替换 为 浮动 机 晶体 管 。 浮 动 栅 不 与 任何 线 物 理 连接 。 
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当 应 用 合适 的 高 电 平 时 ， 将 产生 从 绝缘 体 到 浮动 机 的 电子 沟 道 ， 从 而 开启 晶体 管 ， 把 位 线 连接 
到 字 线 ( 译 码 器 的 输出 )。 当 EPROM 暴露 在 强烈 的 紫外 线 中 大 约 半 小 时 ， 电 子 就 会 从 浮动 机 中 
移 走 ， 从 而 关闭 晶体 管 。 这 两 个 过 程 分 别称 为 编程 (programming) M (erasing), BTR 
PROM(Electrically Erasable PROM, EEPROM) 和 闪存 (flash) 采 用 相似 的 工作 原理 ， 但 它们 在 世 
片上 由 电路 负责 擦 除 ， 而 不 需要 紫外 线 。EEPROM 位 单元 可 单独 擦 除 。 闪 存 擦 除 更 大 的 位 块 ， 
所 以 需要 的 擦 除 电 路 更 少 ， 价 格 更 便宜 。2012 年 ， 闪 存 的 价格 约 为 1 $/GB， 而且 还 以 每 年 
30% ~40% 的 速度 持续 下 降 。 闪 存 广泛 应 用 于 便携 式 电 池 供 电 系统 (如 数码 相机 和 音乐 播放 器 ) 
中 存储 大 量 数据 。 

总 之 ， 现 代 ROM 不 再 只 读 ， 它 们 也 可 以 编程 ( 写 人 )。RAM 和 ROM 的 不 同 在 于 ，ROM 的 
写 人 时 间 更 长 ， 但 它 是 非 易 失 的 。 


5.5.7 使 用 存储 器 阵列 的 逻辑 


尽管 存储 器 阵列 最 初 用 于 存储 数据 ， 但 它 也 可 以 实现 组 合 逻 辑 功能 。 例 如 ， 在 图 5-49 中 
ROM 的 输出 数据 ,是 两 个 地 址 输入 的 XOR。 同 样 ， 数 据 ,是 两 个 输入 的 NAND。 一 个 2 字 xM 位 
存储 器 可 以 实现 任何 NN 输入 和 及 输出 的 组 合 逻辑 功能 。 例 如 ， 图 5-49 中 的 ROM 实现 了 两 个 输 
入 的 3 种 逻辑 功能 。 

用 于 执行 逻辑 的 存储 阵列 称 为 查找 表 (LookUp Table, LUT), Al 5-52 是 一 个 用 作 查 找 表 的 
4 字 x1 位 存储 阵列 ， 它 执行 Y= 4B 函数 。 用 存储 器 实现 逻辑 时 ， 用 户 可 以 根据 给 出 的 输入 组 
合 (地 址 ) 来 查找 输出 值 。 每 个 地 址 对 应 真 值 表 的 一 行 ， 每 个 数据 位 对 应 一 个 输出 值 。 

4 字 x 1 位 阵列 





真 值 表 





图 5-52 用 作 查 找 表 的 4 字 xl 位 存储 器 阵列 


5. 5.8 存储 器 HDL 


HDL fj 5.7 描述 一 个 2" 字 xM 位 的 RAM。 该 RAM 有 一 个 同步 写 使 能 。 换 言 之 ， 当 写 使 能 
we 有 效 时 ， 在 时 钟 的 上 升 沿 就 会 发 生 写 入 。 读 则 可 以 立刻 得 到 结果 。 当 第 一 次 加 电 时 ，RAM 
的 内 容 是 不 可 预知 的 。 

HDL 例 5.8 描述 了 一 个 4 字 x3 位 ROM, ROM WARE HDL case 语句 中 说 明 。 像 这 
样 小 的 ROM 应 该 可 能 被 综合 成 逻辑 门 电路 而 不 是 阵列 。 注 意 ，HDL 例 4.24 的 7 段 显示 译 码 器 
综合 为 图 4-20 的 ROM, 
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HDL #ij 5.7 RAM 


SystemVerilog VHDL 
module ram #(parameter N=6, M= 32) library IEEE; use IEEE.STD_LOGIC_1164.ALL; 

(input logic elk, use LEEE.NUMERIC_STD_UNSIGNED.ALL; 

input logic we, 

input logic [N=1:0] adr, entity ram_array is 

input logic [M-1:0] din, generic(N: integer := 6; M; integer := 32); 

output logic [M-1:0] dout); port(clk, 
we: in STO_LOGIC; 
logic [M-1:0] mem [2**N-1:0]; adr: in STO_LOGIC_VECTOR(N-1 downto 0); 


din: in STD_LOGIC_VECTOR(M-1 downto 0); 


always_ff @(posedge clk) dout: out STD_LOGIC_VECTOR(M-1 downto 0)); 


if (we) mem [adr] <= din; 


end; 
assign dout = mem([adr]: architecture synth of ram_array is 
endmodule type mem_array is array ((2**N-1) downto 0) 


of STD_LOGIC_VECTOR (M-1 downto 0); 
signal mem: mem_array: 
begin : 
process(clk) begin 
if rising_edge(clk) then 
if we then mem(TO_INTEGER(adr)) <=din; 
end if; 
end if; 
end process; 


dout <= mem(TO_INTEGER(adr)); 
end; 












rami 
RADDR[5:0] 


DATA[31:0] 


WADDR{5:0] 
WE[0] 
CLK 


DOUT[31:0] 


mem[31:0] 


5-53 ”综合 后 的 RAM 


HDL 例 5.8 ROM 
SystemVerilog VHDL 


module rom(input logic [1:0] adr, library IEEE; use IEEE.STD_LOGIC_1164.a11; 


output logic [2:0] dout): entity rom is 


always_comb port(adr: in STD_LOGIC_VECTOR(1 downto 0); 

case(adr) dout: out STD_LOGIC_VECTOR(2 downto 0)); 
2'b00; dout <= 3'b011; end; 
2'bO1: dout <= 3'b110; 
2'b10: dout <= 3'b100; architecture synth of romis 
2'bll: dout <= 3'b010; begin 

endcase process(all) begin 

endmodule case adr is 


when "00" => dout <= "011"; 
when "01" => dout <= "110"; 
when "10" => dout <= "100"; 
when "11" => dout <= "010"; 
end case; 
end process; 
end; 


5.6 逻辑 阵列 


与 存储 器 一 样 ， 门 也 可 以 组 织 成 规则 阵列 。 如 果 门 之 间 的 连接 是 可 以 编程 的 ， 那 么 这 些 怕 
辑 阵 列 (logic array) 就 可 以 执行 任何 功能 而 不 需要 使 用 者 以 特定 的 方式 连 线 。 规 则 结构 可 以 简 
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化 设计 。 逻 辑 阵列 可 以 大 量 生产 ， 所 以 它 并 不 晶 贵 。 软 件 工具 允许 用 户 将 逻辑 设计 映射 到 这 些 
阵列 上 。 大 部 分 的 逻辑 阵列 是 可 重 构 的 ， 这 人 允许 设计 者 不 需要 替换 硬件 就 可 以 修改 设计 。 在 开 
发 过 程 中 ， 可 重 构 的 能 力 很 有 价值 ， 而 且 在 现场 也 很 有 用 ， 因 为 简单 下 载 新 配置 后 就 可 以 升级 
系统 。 

本 市 介绍 两 种 类 型 的 逻辑 阵列 ， 可 编程 逻辑 阵列 ( Programmbale Logic Array, PLA) 和 现场 
可 编程 门 阵列 ( Field Programmable Gate Mrray，FPCA ) 。 可 编程 逻辑 阵列 是 一 个 相对 老 的 技术 ， 
它 只 能 实现 组 合 逻 辑 。FPGA 可 以 实现 组 合 和 时 序 逻 辑 。 


5.6.1 可 编程 逻辑 阵列 


可 编程 逻辑 阵列 ( PLA) 以 与 或 (SOP) 的 形式 实现 两 级 组 合 逻 辑 。 如 图 5-54 所 示 ，PLA 由 一 
个 AND 阵列 和 后 跟 的 OR 阵列 组 成 。 输 入 ( 真 值 形式 和 输入 
取 反 形式 ) 驱动 AND 阵列 。 它 产生 的 蕴含 项 依次 做 OR 
运算 来 形成 输出 。 一 个 MxNxP 位 的 PLA 有 MM 位 输入 、 
N 位 蕴含 项 和 P 位 输出 。 

图 5-55 显示 了 实现 函数 X=4BC+4BC 和 了 =48B 的 
3 x3 x2 位 PLA 的 点 表示 法 。AND 阵列 的 每 一 行 形成 一 
个 蕴含 项 。AND 阵列 每 一 行 中 的 点 表示 组 成 蕴含 项 的 
项 。 图 5-55 中 的 AND 阵列 形成 了 3 个 蕴含 项 4 BC、 图 5-54 MxNxP 位 PLA 
ABC 和 AB。OR 阵列 的 点 说 明 输出 函数 中 包含 了 哪些 蕴含 项 。 

图 5-56 显示 了 如 何 使 用 两 级 逻辑 来 组 成 PLA。 另 一 种 实现 将 在 5. 6. 3 节 中 介绍 。 


7. Ge @ 
OR 阵 列 
4 B C OR 阵列 


ee Leeds 








AND 阵 列 irs AND 阵 列 x Y 
图 5-55 3x3x247 PLA: 点 表示 法 图 5-56 使 用 用 两 级 逻辑 构成 的 3 x3 x2 位 PLA 

ROM 可 以 看 作 PLA 的 一 种 特殊 情况 。 一 个 2" 字 xN 位 的 ROM 就 是 一 个 Mx2' xN 位 的 
PLA。 与 AND 阵列 一 样 ， 译 码 器 产生 所 有 2" 个 最 小 项 。 与 OR 阵列 一 样 ，ROM 阵列 产生 所 有 的 
输出 。 如 果 函 数 不 需 要 依赖 所 有 的 2 个 最 小 项 ， 则 PLA 就 比 ROM 小 。 例 如 ， 为 了 实现 图 5-55 和 
5-56 中 3 x3 x2 位 PLA 的 功能， 需要 一 个 8 字 x2 位 ROM。 

简单 可 编程 远 辑 器 件 (Simple Programmable Logic Device, SPLD) 增强 了 PLA 的 功能 ， 它 在 
AND/OR 阵列 中 加 入 寄存 器 和 各 种 其 他 的 特殊 功能 。 然 而 ，PLD 和 PLA 大 都 被 FPGA 取代 ， 因 
为 在 建立 大 型 系统 时 FPGA 更 灵活 和 高 效 。 


5.6.2 现场 可 编程 逻辑 门 阵 列 


现场 可 编程 逻辑 门 阵列 ( Field Programmable Gate Array ，FPCA) 是 一 个 可 重 构 的 门 阵列 。 通 
过 软件 编程 工具 ， 使 用 者 可 以 用 硬件 描述 语言 或 原理 图 在 FPGA 上 完成 设计 。 基 于 某 些 原因 ， 
FPGA 比 PLA 更 灵活 ， 功 能 也 更 强大 。FPGA 可 以 实现 组 合 和 时 序 逻 辑 ， 还 可 以 实现 多 级 逻辑 
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功能 ， 而 PLA 只 能 实现 两 级 逻辑 。 现 代 的 FPGA 还 集成 了 其 他 有 用 的 功能 ， 如 内 置 乘法 器 、 高 
速 WO、 数据 转换 器 (包括 数 模 转换 器 ) 、 大 型 RAM 阵列 和 处 理 器 等 。 


FPGA 是 可 配置 逻辑 元 件 (Logic Element, 

LE) 阵列 ， 也 称 为 可 配置 远 辑 单元 (Configurable 
本 回回 回回 加 
lok 


Logic Block，CLB) 。 每 个 LE 可 以 配置 为 实现 


组 合 逻 辑 或 者 时 序 逻 辑 功 能 。 图 5-57 为 FPGA 

的 通用 模块 图 。LE 被 与 外 部 接口 的 输入 /输出 
oe Le] =) [lp 
本 回国 回回 有 
JOE 


7U4* (Input/Output Element, IOE) 包围 。IOE 将 
JOE 
加 













LE 输入 /输出 与 芯片 封装 的 管 脚 连接 。 通 过 可 
编程 布线 通道 将 LE 与 其 他 LE 和 IOE 连接 在 
一 起 。 

两 家 领先 的 FPGA 制造 商 是 Altera 公司 和 
Xilinx 公司 。 5-58 六 Altera 公司 2009 年 推出 
的 Cyclone IV FPGA 中 的 一 个 LE。 该 LE 的 关键 
部 分 是 一 个 4 输入 查找 表 ( LUT) 和 一 个 1 位 寄 
存 器 。LE 还 包含 可 配置 复 用 器 ， 路 由 信号 通过 
LE。 通 过 确定 查找 表 的 内 容 和 复 用 器 的 选择 信 
号 来 配置 FPCA。 


vo [UE] [ue] [ue] [ue] fog 
Ff fo] Fo) fe 


5-57 通用 FPGA 结构 图 


全 LAB 
从 前 一 个 LE 的 同步 载 入 寄存 器 旁 路 





来 的 寄存 器 链 
全 LAB 
LE 进位 输入 的 同步 清除 可 编程 寄存 器 
数据 1 行 、 列 
ae 和 直接 链接 
数据 3 ae 
数据 4 
行 、 列 
和 直接 链接 
路 由 
非 同步 
全 芯片 重 置 | 清除 逻辑 + pat 本 地 路 由 
寄存 器 反馈 (DEV_CLRn) 
有 寄存 器 链 输 出 


时 钟 使 能 选择 


coer Se 


labclkena 2 


图 5-58 Cyclone IV LE 


Cyclone IV LE 有 一 个 4 输入 LUT 和 一 个 触发 器 。 为 查找 表 加 载 合 适 的 值 后 ， 可 以 配置 LUT 
来 实现 最 多 4 变量 的 任意 函数 。 配 置 FPCA 时 还 需要 包括 选择 信号 ， 该 信号 决定 数据 如 何 通过 
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复 用 器 从 LE 路 由 到 邻近 的 LE 和 IOE。 例 如 ， 根 据 复 用 器 的 配置 ，LUT 将 从 数据 3 或 LE 自 带 
寄存 器 的 输出 接收 一 个 输入 ， 并 总 是 从 数据 1、 数 据 2 和 数据 4 接收 其 余 3 个 输入 。 数 据 1 ~ 数 
据 4 的 输入 来 自 IOE 或 其 他 LE 的 输出 ， 这 由 LE 外 部 布线 决定 。LUT 的 输出 要 么 直接 传送 到 组 
合 函数 的 LE 的 输出 ， 要 么 由 寄存 器 函数 的 触发 器 提供 。 触 发 器 的 输入 可 能 来 自 它 自 己 的 LUT 
输出 、 数 据 3 输入 或 者 前 一 个 LE 的 寄存 器 输出 。 额 外 的 硬件 还 包括 : 支持 使 用 进位 链 硬 件 的 
加 法 、 用 于 路 由 的 多 路 选择 器 以 及 触发 器 使 能 端 和 复位 键 。Altera 公司 将 16 个 LE 组 合 在 一 起 
构成 一 个 逻辑 阵列 单元 ( Logic Array Block ，LAB ) 并 提供 LAB 内 的 LE 之 间 的 本 地 连接 。 

总 的 来 说 ，Cyclone IV LE 可 以 实现 一 个 最 多 4 变量 的 组 合 函 数 和 寄存 器 函数 。 其 他 品牌 的 
FPGA 可 能 在 结构 上 有 些 差 异 , 但 都 遵循 相同 的 设计 原则 。 例 如 ，Xilinx 7-series FPGA 使 用 6 
输入 LUT 而 不 是 4 输入 LUT。 

在 配置 FPGA 时 , 设计 者 首先 创建 设计 的 原理 图 或 者 硬件 描述 语言 。 随 后 ,设计 被 综合 到 
FPGA 上 。 综 合 工具 决定 LUT、 复 用 器 和 布线 通道 如 何 配置 来 实现 特定 的 功能 。 最 后 ， 这 些 配置 
信息 可 以 下 载 到 FPCA 上 。 因 为 Cyclone FPGA 在 SRAM 上 存储 配置 信息 ， 所 以 它们 的 编程 非常 简 
单 。 在 系统 加 电 时 ， 配 置信 息 可 以 从 实验 室 的 计算 机 或 者 EEPROM 芯片 中 下 载 内 容 到 FPGA 
SRAM 上 。 有 些 制造 商 的 FPCA 上 直接 包含 EEPROM ， 或 者 使 用 一 次 可 编程 熔 丝 来 配置 FPCA。 

使 用 LE 实现 特定 功能 

解释 如 何 配置 一 个 或 多 个 Cyclone IV LE 来 实现 以 下 功能 : 

(a) X=ABC+ABC 和 Y=AB 

(b) Y=JKLMPOR 

(c) 二 进 制 状态 编码 的 3 分 频 计 数 器 ( 见 图 3-29a) 

你 可 能 需要 画 出 LE 之 间 的 连接 。 

解 : (a) 配置 两 个 LE, 一 个 LUT 计算 外， 男 一 个 LUT 计算 Y， 如 图 5-59 所 示 。 对 于 第 一 
LE, 输入 数据 1、 数据 2、 数 据 3 分 别 代 表 4、B8、C( 这 些 连接 由 布线 通道 设置 ) 。 数 据 4 是 
一 个 无 关 项 ， 但 它 不 能 浮 空 ， 因 此 它 连 接 到 0。 对 于 第 二 个 LE， 输 入 数据 1 和 数据 2 别 代 表 4 
和 B。 其 他 输入 端 是 无 关 项 ， 并 且 都 连接 到 0。 配 置 最 后 一 级 复 用 器 选择 来 自 LUT 的 组 合 输出 ， 
‘ERX ALY, 一 般 而 言 ， 一 个 LE 可 以 用 这 种 方式 计算 最 多 4 变量 的 任意 函数 。 


(A) (B) (©) (X) 
数据 1 数据 2 数据 3 数据 4 





0 
1 
0 
J 
0 
1 
0 
$ 


DS Da ba OK OK OM ODS 
POOOOP 








5-59 用 LE 配置 两 个 4 Ee RK 


(b) 配置 第 一 个 LE 的 LUT Rit X = JKLM, 第 二 个 LE 的 LUT 计算 Y=XPQOR。 配 置 最 后 
的 复 用 器 选择 每 个 LE HASH AXA Y, 配置 如 图 5-60 所 示 。LE 间 的 布线 通道 用 虚线 表示 ， 
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连接 LE] 的 输出 和 LE2 的 输入 。 一 般 而 言 ， 一 组 LE 可 以 用 这 种 方式 计算 N 输入 变量 的 函数 。 


WY W D M (x) (P) @ ® @® (Y) 
数据 1 数据 2 数据 3 数据 4| LUT 输 出 


数据 1 数据 2 数据 3 数据 4| LUT 输 出 





0 0 0 0 0 0 0 0 0 0 
0 0 0 1 0 0 0 0 1 0 
0 0 1 0 0 0 0 l 0 0 
0 0 I 1 0 0 0 1 1 0 
0 J\ 0 0 0 0 1 0 0 0 
0 1 0 1 0 0 1 0 1 0 
0 1 1 0 0 0 1 1 0 0 
0 1 1 1 0 0 1 1 1 0 
1 0 0 0 0 1 0 0 0 0 
1 0 0 1 0 1 0 0 1 0 
1 0 1 0 0 1 0 1 0 0 
1 0 1 1 0 1 0 1 1 0 
1 1 0 0 0 1 1 0 0 0 
1 1 0 1 0 1 1 0 1 0 
1 1 1 0 0 1 1 1 0 0 
1 1 1 1 1 1 1 1 1 1 


数据 1 
ima 0 are Y 
Le 数据 4 LUT 





LE 1 
图 5-60 用 LE 配置 多 于 4 输入 的 函数 


(c)FSM 有 两 位 状态 (5,.,。) 和 一 个 输出 (Y)。 下 一 个 状态 基于 当前 状态 的 两 位 。 使 用 两 个 
LE 从 当前 状态 计算 下 一 个 状态 ， 如 图 5-61 所 示 。 使 用 分 别 在 两 个 LE 上 的 2 个 触发 器 来 保存 
状态 。 触 发 器 有 一 个 连接 到 外 部 复位 (Reset) 信 号 的 复位 输入 。 寄 存 器 的 输出 使 用 数据 3 上 的 
多 复 用 器 和 LE 间 的 布线 通道 反馈 回 LUT 输入 ， 这 用 虚线 表示 。 一 般 来 说 ， 需 要 另 一 个 LE 来 
计算 输出 Y。 然 而 ， 在 这 个 例子 中 ， 了 = So， 所 以 了 可 以 来 自 LE1。 因 此 ， 整 个 FSM 可 以 放 在 
两 个 LE 中 。 总 的 来 说 ，FSM 的 每 一 位 状态 需要 至 少 一 个 LE。 如 果 用 于 计算 输出 或 者 下 一 个 状 
态 的 逻辑 非常 复杂 而 不 能 放 在 一 个 LUT 中 ， 则 它 也 许 需 要 更 多 的 LE, 


(S.) (83 (S,') 
数据 1 数据 2 数据 3 数据 4| LUT 输 出 


X X 0 0 

X X 0 1 0 
X X 1 0 0 
X X 1 1 0 


(S,) (S,) (S, 
数据 1 数据 2 数据 3 数据 4| LUT 输 出 
x 0 0 


ps 

” 

| 

orgo 
oor 





R 5-61 两 位 状态 有 限 状 态 机 的 LE 配置 a 


LE 延迟 

Alyssa P. Hacker 正在 设计 一 个 必须 运行 在 200MHz 的 有 限 状 态 机 。 她 使 用 Cyclone IV GX 
FPGA. FPGA 的 特性 是 : 对 于 每 一 个 LE，tis =381ps; 对 于 所 有 的 触发 器 ，t.。,, =76ps，t,。。 = 
199ps。LE 间 的 连接 延迟 为 246ps。 假 设 触发 器 的 保持 时 间 为 0。 她 的 设计 中 最 多 可 以 用 多 少 
个 LE? 

ft: Alyssa 使 用 式 (3-13 ) 求 解 该 逻辑 的 最 大 传播 延迟 : ta ST. (ts tiep) o 
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Alte, ¢,,<5ns - (0. 199ns +0. 076ns) LA t,<4.725ns, A LE 的 延迟 加 上 LE 间 的 线路 
HEIR tik ,是 381ns +246ns =627ns。LE 的 最 大 数 V 需要 满足 Wi vin S4 725ns, AUK N=7, <4 


5. 6.3 阵列 实现 * 


为 了 减少 尺寸 和 成 本 ，ROM 和 PLA 一 般 使 用 类 nMOS 或 者 动态 电路 (参见 1.7.8 节 ) 而 不 
是 滑 用 的 逻辑 门 。 f 

图 5-62a 为 一 个 4x3 位 ROM 的 点 表示 法 。 它 实现 以 下 函数 : X=AOB, Y=A+B M Z= 
AB。 为 了 与 图 5-49 中 的 函数 一 致 ， 将 地 址 输入 重 命 名 为 4 和 B， 数 据 输 出 重 命名 为 了 、Y 和 2。 
图 5-62b 给 出 了 类 nMOS 实现 。 每 一 个 译 码 器 输出 都 连接 到 它 这 一 行 nMOS 晶体 管 的 门 上 。 注 
意 ， 在 类 nMOS 电路 中 ， 只 在 通过 下 拉 (nMOS) 网 络 到 GND 没有 路 径 时 ， 弱 pMOS 晶体 管 才 输 
出 高 电 平 。 





a) 点 表示 法 = b) 类 nMMOS 电 路 
图 5-62 ROM 的 实现 


下 拉 晶 体 管 放 置 在 每 个 没有 点 表示 的 交汇 点 上 。 图 5-62a 中 的 点 留 在 了 图 5-62b 中 ， 这 样 
可 以 方便 比较 。 弱 上 拉 晶 体 管 将 没有 下 拉 晶 体 管 的 每 个 字 线 的 输出 拉 到 高 电 平 。 例 如 ， 当 
AB =11 时 ， 字 线 11 WABE., X, Z 上 的 晶体 管 就 打开 ， 把 它们 的 输出 拉 为 低 电 平 。 了 输出 没 
有 连接 到 字 线 11 的 晶体 管 ， 所 以 了 被 弱 上 拉 唱 体 管 拉 高 。 

PLA 也 可 以 用 类 nMOS 电路 实现 ， 图 5-63 为 图 5-55 中 PLA 的 实现 。 在 AND 阵列 中 ， 下 拉 
晶体 管 放 在 没有 点 的 位 置 ; 在 OR 阵列 中 ， 放 置 在 有 点 的 行 上 。 在 它们 传送 到 输出 位 前 ，OR 
阵列 的 每 列 都 经 过 一 个 反 相 器 传送 。 同 样 ， 图 5-63 中 保留 了 图 5-55 的 点 以 方便 比较 。 


4 B C OR 阵列 






y y y 


AB 
7 la e] 


ANDRE JIJ X Y 
图 5-63 HÆ nMOS 电路 实现 的 3 x3 x2 位 PLA 
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5.7 总 结 


本 章 介 绍 了 许多 数字 系统 中 使 用 的 数字 模块 ， 它 们 包括 加 法 器 、 减 法 器 、 比 较 器 、 移 位 
器 、 乘 法 器 和 除法 器 等 算术 电路 ; 计数 器 和 移 位 寄存 器 等 时 序 电 路 ; 存储 器 阵列 和 逻辑 阵列 。 
本 章 还 探讨 了 小 数 的 定点 和 浮 点 表示 法 。 第 7 章 将 使 用 单元 电路 来 构造 微 处 理 器 。 

加 法 器 是 大 部 分 算术 电路 的 基础 。 半 加 器 把 两 个 1 位 输入 4 和 B 相 加 ， 产 生 1 位 和 及 1 位 
进位 。 全 加 器 扩展 了 半 加 器 以 便 接收 进位 输入 。N 个 全 加 器 可 以 级 联 组 成 一 个 进位 传播 加 法 器 
(CPA)， 它 实现 两 个 位 数 的 加 法 。 因 为 进位 逐次 通过 每 一 个 全 加 器 ， 所 以 这 类 CPA KAT 
波 进位 加 法 器 。 更 快 的 CPA 可 以 使 用 先行 进位 或 前 缀 技术 。 

减法 器 把 减 数 变 为 负数 ， 把 它 与 被 减 数 相 加 。 量 值 比较 器 把 一 个 数 与 男 一 个 数 相 减 ， 根 据 
结果 的 符号 判断 它们 的 关系 。 乘 法 器 使 用 与 门 电 路 形成 中 间 结 果 ， 并 把 这 些 中 间 结 果 使 用 全 加 
器 相 加 。 除 法 器 重复 地 从 中 间 余 数 中 减 去 除数 ， 并 检查 差 的 符号 来 决定 商 位 。 计 数 器 使 用 加 法 
器 和 寄存 器 来 递增 当前 计数 。 

使 用 定点 或 浮 点 形式 表示 小 数 。 和 定点 数 与 十 进 制 数 相 似 ， 浮 点 数 与 科学 计数 法 相似 。 定 点 
数 使 用 普通 算术 电路 ， 而 浮 点 数 要 求 更 多 复杂 的 硬件 来 提取 和 处 理 符号 、 阶 码 和 尾数 。 

大 型 存储 器 按 字 阵 列 方式 组 织 。 存 储 器 有 一 个 或 者 更 多 的 端口 完成 字 的 读 和 写 。 掉 电 时 ， 
易 失 存储 器 (如 SRAM 和 DRAM) 就 会 丢失 它们 的 状态 。SRAM H DRAM Etk, 但 是 需要 更 多 的 
晶体 管 。 寄 存 器 文件 是 小 型 多 端口 SRAM 阵列 。 非 易 失 存储 器 (ROM ) 可 以 无 限 长 地 保持 它们 
的 状态 。 尽 管 名 字 为 ROM， 但 是 现代 大 部 分 的 ROM 也 可 以 写 入 。 

可 以 采用 规则 阵列 来 创建 逻辑 。 存 储 器 阵列 可 以 用 作 查 找 表 ， 执行 组 合 函数 。PLA 用 可 配 
AY AND 和 OR 阵列 连接 组 成 。 它 们 只 能 实现 组 合 逻 辑 。FPCA 由 大 量 的 小 型 查找 表 和 寄存 器 
组 成 ， 可 以 实现 组 合 逻 辑 和 时 序 逻 辑 。 查 找 表 的 内 容 和 它们 的 内 部 连接 可 以 配置 ， 用 于 执行 任 
TLAK. WIR FPGA 可 以 非常 简单 地 重 编程 ， 具 有 足够 大 的 容量 和 便宜 的 价格 来 构造 专用 
数字 系统 ， 所 以 它们 广泛 应 用 于 中 小 型 商业 和 教育 产品 中 。 


习题 

5.1 以 下 3 种 64 位 加 法 器 的 延迟 是 多 少 ? 假设 每 一 个 2 输入 门 的 延迟 是 130ps， 全 加 器 的 延 
We 450ps。 
(a) 行 波 进位 加 法 器 
(b) 4 位 单元 的 先行 进位 加 法 器 
(c) 前 级 加 法 器 

5.2 设计 2 个 加 法 器 : 一 个 是 64 位 的 行 波 进位 加 法 器 ， 另 一 个 是 4 位 单元 的 64 位 先行 进位 
加 法 器 。 只 使 用 2 输入 门 。 每 一 个 2 输入 门 的 面积 为 15pm ， 延 迟 为 S0ps， 门 电容 为 
20pF。 假设 静 态 电 源 可 以 忽略 。 
(a) 比较 两 种 加 法 器 的 面积 、 延 迟 和 功 耗 ( 运 行 频率 为 100MHz， 运 行 电压 为 1.2V)。 
(b) 讨论 在 功 耗 、 面 积 和 延迟 之 间 的 折 中 。 

5. 3 讨论 设计 者 为 什么 会 选择 行 波 进位 加 法 器 代替 先行 进位 加 法 器 。 

5.4 用 硬件 描述 语言 设计 图 5-7 的 16 位 前 级 加 法 器 。 模 拟 和 测试 你 的 模块 ， 证 明 它 能 正确 

5.5 图 5.7 所 示 的 前 级 网 络 使 用 黑色 单元 计算 所 有 的 前 级 。 有 些 单元 传播 信号 并 不 是 必需 的 。 
设计 一 个 灰色 单元 ， 它 从 位 i:k 和 上 -1:j 接 收 G 和 PP 信号, 但 只 产生 Gy, MAE P,,. 
重 画 前 缀 网络， 在 需要 的 地 方 把 黑色 单元 替换 为 灰色 单元 。 
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5. 6 


5.9 


5. 10 


a 
lh 
N 


图 5-7 PR BY HT RP 2 AR Ze FET RT TB] A A BT ME — 77 IE. Kogge-Stone 网 络 是 


男 一 个 常见 的 前 缀 网络 ， 它 实现 一 样 的 功能 ,但 使 用 不 同 的 黑色 单元 连接 。 研 究 Kogge- 


Stone MAA, HH FA S-7 相似 的 原理 图 来 表示 在 Kogge- Stone 中 的 黑色 单元 连接 。 

一 个 入 输入 优先 级 译 码 器 有 log, N 位 输出 ， 编 码 哪 一 个 输入 可 以 得 到 最 高 优先 级 (参见 习 

fil 2. 36)。 

(a) 设计 一 个 入 输 入 优先 级 编码 器 ， 延 迟 按 N 的 对 数 增加 。 画 出 电路 原理 图 ， 用 电路 元 
件 的 延迟 给 出 电路 的 延迟 。 

(b) 用 人 硬件 描述 语言 编码 设计 。 模 拟 和 测试 相应 的 模块 ， 证 明 它 能 正确 地 运行 。 

设计 以 下 3 种 的 32 位 数 比 较 器 。 画 出 电路 原理 图 。 

(a) 不 等 

(b) KF 

(c) 小 于 或 等 于 

使 用 自己 习惯 用 的 硬件 描述 语言 设计 图 5-15 所 示 的 32 位 ALU。 可 以 设计 顶层 行为 或 结 

构 模 块 。 

为 习题 5.9 的 32 位 ALU 增加 一 个 上 溢 输 出 。 当 加 法 器 的 结果 上 洲 时 ,输出 为 TRUE, 

否则 为 FALSE, 

(a) 为 上 溢 输 出 写 布尔 表达 式 。 

(b) 画 出 上 海 电 路 。 

(c) 用 硬件 描述 语言 设计 修 进 的 ALU。 

为 习题 5.9 的 32 位 ALU 增加 一 个 零 (Zero) 输 出 。 当 Y==0 时 ,输出 是 TRUE, 

编写 测试 程序 来 测试 习题 5.9、 习 题 5. 10、 习 题 5.11 的 32 位 ALU。 然 后 使 用 它 测试 

ALU。 包 括 需 要 的 任何 测试 向 量 文件 。 确 保 测试 了 足够 的 分 支 用 例 ， 使 人 信服 ALU 的 

功能 是 正确 的 。 

设计 一 个 把 32 位 输入 左 移 两 位 的 移 位 器 。 输 入 和 输出 都 是 32 位 。 用 文字 解释 设计 ， 并 

画 出 电路 图 。 用 自己 习惯 使 用 的 硬件 描述 语言 实现 设计 。 

设计 一 个 4 位 向 左 和 向 右 的 循环 移 位 器 。 画 出 电路 图 ， 用 自己 习惯 使 用 的 硬件 描述 语言 

实现 设计 。 

使 用 24 个 2: 1 复 用 器 设计 一 个 8 位 左 移 位 器 。 移 位 器 包括 8 位 输入 4，3 位 移 位 量 

shamt,,, 8 位 输出 Yo 画 出 电路 图 。 

解释 如 何 用 Nlog,N 个 2: 1 复 用 器 创建 任意 N 位移 位 器 或 者 循环 移 位 器 。 

图 5-64 的 漏斗 移 位 器 (funnel shifter) 可 以 实现 任何 NN 位 移 位 或 者 循环 移 位 操作 。 它 将 

2N 位 输入 右 移 位 。 输 出 了 为 结果 的 最 低 和 NN 位。 输入 的 最 高 V PAB, BARN MEER 

为 C。 选 择 合适 的 B、C、k， 泌 斗 移 位 器 就 可 以 实现 ony 


任何 类 型 的 移 位 或 者 循环 移 位 。 在 以 下 情况 下 ， 使 pry 


FA A. shamt, N 解释 这 些 值 ， 


(a) A 逻辑 右 移 shamt 位 ATT i . 
(b) 4 算术 右 移 shamt 位 N N-I “0 


(d) A 右 循 环 移 位 shamt 位 
(e) 4 左 循环 移 位 shamt 位 
找 出 图 5-18 中 4 x4 乘法 器 的 关键 路 径 。 用 AND 门 延迟 (tw ) 和 全 加 器 延迟 (tn ) 给 出 。 
同样 ，N x N 乘法 器 的 延迟 是 多 少 ? 


图 5-64 漏斗 移 位 需 
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找 出 图 5-20 中 4 x4 除法 器 的 关键 路 径 。 用 2:1 复 用 器 延迟 (twx)、 全 加 器 延迟 (tw ) 和 
BORA A HEIR (tny) th. RE, N xN 除法 器 的 延迟 是 多 少 ? 

设计 一 个 处 理 二 进 制 补 码 的 乘法 器 。 

通过 将 输入 的 最 高 位 复制 到 输出 的 高 位 ， 符 号 扩展 单元 (sign extension unit ) 将 M 位 二 进 
制 补 码 输入 扩展 到 六 位 (W>M)( 人 参见 1.4.6 节 )。 它 接收 一 个 虹 位 输入 4， 产 生 一 个 和 
位 输出 Yo 画 出 一 个 4 位 输入 、8 位 输出 的 符号 扩展 单元 。 写 出 你 设计 的 HDL 代码 。 
通过 把 零 放 在 输出 的 高 位 ， 零 扩展 单元 (zero extension unit) 将 位 无 符号 数 扩展 到 N 位 
(NW>MH)。 画 出 一 个 4 位 输入 、8 位 输出 的 零 扩 展 单元 。 写 出 你 设计 的 HDL 代码 。 

以 二 进 制 计算 111001. 000,/001100. 000; ， 使 用 初中 标准 算术 除法 。 说 明 运 算 过 程 。 

以 下 数字 系统 的 数据 表示 区 间 分 别 是 多 少 : 

(a) 24 位 无 符号 定点 数 ， 其 中 包含 12 位 整数 位 和 12 位 小 数位 。 

(b) 24 位 带 符 号 的 原 码 定点 数 ， 其 中 包含 12 位 整数 位 和 12 位 小 数位 。 

(c) 24 位 2 进 制 补 码 定点 数 ， 其 中 包含 12 位 整数 位 和 12 位 小 数位 。 

以 16 位 定点 带 符 号 的 原 码 (其 中 8 位 整数 位 和 8 位 小 数位 ) 表示 以 下 10 进 制 数 。 以 16 
进 制 表示 结果 。 

(a) -13.5625 

(b) 42.3125 

(c) -17. 15625 

以 12 位 定点 带 符 号 的 原 码 (其 中 6 位 整数 位 和 6 位 小 数位 ) 表 示 以 下 10 进 制 数 。 以 16 
进 制 表 示 结 果 。 

(a) -30.5 

(b) 16.25 

(c) -8.078125 

以 16 位 定点 二 进 制 补 码 形式 (其 中 8 位 整数 位 和 8 位 小 数位 ) 表 示 习 题 5. 25 的 10 进 制 
数 。 以 16 进 制 表示 结果 。 

以 12 位 定点 二 进 制 补 码 形式 (其 中 6 位 整数 位 和 6 位 小 数位 ) 表 示 习 题 5. 26 的 10 进 制 
数 。 以 16 进 制 表示 结果 。 

以 TERE 754 单 精度 浮 点 数 格式 表示 习题 5.25 的 10 进 制 数 。 以 16 进 制 表示 结果 。 

以 IEEE 754 单 精度 浮 点 数 格式 表示 习题 5. 26 的 10 进 制 数 。 以 16 进 制 表示 结果 。 

把 以 下 的 二 进 制 补 码 定点 数 转换 成 10 进 制 

(a) 0101. 1000 

(DY TIEL TINI 

(c) 1000. 0000 

把 以 下 的 二 进 制 补 码 定点 数 转换 成 10 进 制 

(a) 011101. 10101 

(b) 100110. 11010 

(c) 101000. 00100 

当 两 个 浮 点 数 相 加 时 ， 为 什么 阶 码 较 小 的 数 被 移 位 ? 解释 并 给 出 一 个 例子 证 明 你 的 
解释 。 

把 以 下 IEEE 754 单 精度 浮 点 数 相 加 。 

(a) C0123456 + 81C564B7 

(b) DOB10301 + D1 B43203 
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5. 44 


(c) SEF10324 + 5E039020 

把 以 下 IEEE 754 单 精 度 浮 点 数 相 加 。 

(a) C0D20004 +72407020 

(b) C0D20004 +40DC0004 

(c) (SFBE4000 +3FF80000) + DFDE4000 

(为 什么 结果 与 预想 的 不 同 ? 请 解释 ) 

扩展 3.3.2 节 中 实现 浮 点 数 加 法 的 步 又， 使 它 能 与 计算 正 浮 点 数 一 样 计算 负 浮 点 数 。 

考虑 IEEE 754 单 精度 浮 点 数 。 

(a) IEEE 754 单 精 度 浮 点 数 格式 能 表示 多 少 个 数字 ? ANG GA + o 和 NaN, 

(b) MIRAE + 00 和 NaN 的 表示 ， 还 可 以 表示 多 少 个 数字 ? 

(c) 解释 为 什么 +o 和 NaN 用 特殊 的 形式 表示 。 

考虑 以 下 十 进 制 数 : 245 和 0.0625, 

(a) 以 16 进 制 的 形式 写 出 两 个 数 的 单 精 度 浮 点 数 表示 。 

(b) 实现 (a) 中 两 个 32 位 数 的 量 值 比 较 。 换 言 之 ， 将 两 个 32 位 数 作 为 二 进 制 补 码 ， 然 
后 比较 它们 。 整 数 比较 可 以 给 出 正确 的 答案 吗 ? 

(c) 你 准备 使 用 一 个 新 的 单 精度 浮 点 数 表示 法 。 与 IEEE 754 单 精 度 浮 点 数 标准 一 样 ， 
除了 使 用 二 进 制 补 码 表示 阶 码 而 不 是 二 进 制 数 。 用 你 的 新 标准 写 出 两 个 数 。 以 16 
进 制 给 出 答案 。 

(d) 使 用 你 的 新 浮 点 数 表 示 法 ， 可 以 进行 整数 比较 吗 ? 

(e) 为 什么 用 整数 比较 来 对 浮 点 数 进行 比较 更 方便 ? 

使 用 常用 的 HDL 设计 一 个 单 精度 浮 点 数 加 法 器 。 在 用 HDL 对 设计 编码 前 ， 画 出 设计 的 

电路 图 。 模 拟 和 测试 加 法 器 ， 证 明 它 正确 运作 。 你 可 以 只 考虑 正 数 ， 然 后 使 用 向 零售 人 

(EM) 。 你 也 可 以 忽略 表 5-2 中 给 出 的 特殊 情况 。 

开发 一 个 32 位 浮 点 乘法 器 。 乘 法 器 有 两 个 32 位 浮 点 数 输入 并 产生 一 个 32 位 浮 点 数 输 

出 。 你 可 以 只 考虑 整数 ， 使 用 向 零售 人 ( 舍 位 ) 。 你 也 可 以 忽略 表 5-2 中 给 出 的 特殊 

情况 。 

(a) 写 出 实现 32 位 浮 点 数 乘 法 的 步骤 。 

(b) 画 出 32 位 浮 点 数 乘法 器 的 电路 图 。 

(c) 用 HDL 设计 一 个 32 位 浮 点 数 乘 法 器 。 模 拟 和 测试 乘法 器 ， 证 明 它 能 正确 运行 。 

开发 一 个 32 位 前 缀 加 法 器 。 

(a) 画 出 电路 图 。 

(b) 用 HDL 设计 一 个 32 位 前 级 加 法 器 。 模 拟 和 测试 加 法 器 ,证明 它 能 正确 运行 。 

(c) (a) 中 的 32 位 前 级 加 法 器 的 延迟 是 多 少 ? 假设 每 一 个 2 输入 门 的 延迟 是 100ps。 

(d) 设计 一 个 32 位 前 级 加 法 器 的 流水 线 版 本 。 画 出 电路 原理 图 。 流 水 线 前 级 加 法 器 可 
以 运行 得 多 快 ? 可 以 假设 一 个 测试 序列 的 时 间 开 销 (t,。 ,to ) 为 80ps。 使 这 个 设计 
尽 可 能 快 地 运行 。 

(e) 用 HDL 设计 流水 线 32 位 前 缀 加 法 器 。 

递增 器 将 对 N 位 数 加 1。 用 半 加 器 创建 一 个 8 位 递增 器 。 

设计 一 个 32 位 同步 Up/Down 计数 器 。 输 入 信和 号 包括 : Reset 和 Up。 当 Reset 为 1 时 ， 输 

Hake O, FM, 4 Up 为 1 时 ， 电 路 开始 递增 计数 ， 当 Up 为 0 时 ， 电 路 开始 增 减 

计数 。 

设计 一 个 32 位 计数 器 ， 在 每 一 个 时 钟 沿 加 4。 计 数 回 输入 信号 包括 : 复位 和 时 钟 。 当 
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复位 时 ， 所 有 输出 为 0。 

修改 习题 5. 44 的 计数 器 ， 使 它 在 每 个 时 钟 沿 可 以 以 4 递增 ， 或 者 加 载 一 个 新 的 32 位 值 

D， 取 决 于 控制 信号 Load。 当 Load =1 时 ,计数 器 就 加 载 新 值 D。 

NN 位 Johnson 计数 器 由 一 个 带 复位 信号 的 N 位 移 位 寄存 器 组 成 。 移 位 寄存 器 的 输出 Sw 取 

反 ， 然 后 反馈 到 输入 Si。 当 计数 器 复位 时 ， 所 有 位 都 清 零 。 

(a) 说 明 当 4 位 Johnson 计数 器 复位 后 ， 它 立刻 产生 的 输出 序列 Q5.0 0 

(b) N 位 Johnson 计数 器 经 过 多 少 个 周期 就 会 重复 出 现 相同 的 序列 ? 解释 你 的 结果 。 

(c) 使 用 一 个 5 位 Johnson 计数 器 、10 个 AND 门 和 反 相 器 设计 一 个 十 进 制 计数 器 。 十 进 

制 计 数 器 有 时 钟 、 复 位 和 10 个 独 热 输 出 Yoo 当 计 数 器 复位 时 ，Yo 有 效 。 在 每 一 
个 周期 中 ， 下 一 个 输出 将 有 效 入 。10 个 周期 后 ， 计 数 器 必须 重复 。 画 出 十 进 制 计 
Blak HY) Ha Bt A 

(d) 比 起 常用 的 计数 器 ，Johnson 计数 器 有 什么 优点 。 

为 一 个 图 5-37 所 示 的 4 位 可 扫描 触发 器 编写 HDL。 模 拟 和 测试 你 的 HDL 模块 ， 证 明 它 

能 正确 运行 。 

英语 里 有 一 些 元 余 ， 它 们 在 传播 使 用 时 可 以 避免 语义 的 混 消 。 二 进 制 数据 也 有 一 些 元 余 

形式 ， 从 而 可 以 纠正 一 些 错误 。 例 如 ， 数 字 0 可 以 编码 成 00000， 数 字 1 必须 编码 成 

111111。 数 字 在 有 噪声 的 信道 中 传输 ， 这 些 数字 中 最 多 可 能 翻转 两 位 。 接 收回 可 以 重 构 

原始 数据 ， 因 为 在 接收 的 5 位 数据 中 ， 至 少 有 3 位 为 0 才 为 0; 同样 ， 应 该 至 少 有 3 位 

为 1 才 是 1。 

(a) 设计 一 种 编码 方式 ， 它 使 用 5 位 信息 编码 发 送 00、01、10 或 者 11。 可 以 纠正 1 位 

错误 。 提 示 : 不 能 将 00000 和 11111 分 别 编码 为 00 和 11。 

(b) 设计 一 个 电路 ， 它 接收 5 位 编码 数据 ， 然 后 将 它 编码 成 00、01、10、11， 即 使 1 位 

传输 数据 被 更 改 。 

(c) 假设 你 想 改变 成 男 一 种 5 位 编码 。 如 何 实现 你 的 设计 ， 改 变 编码 时 可 以 不 用 修改 

硬件 。 

快速 EEPROM ( 简称 为 闪存 ) 引 起 了 近期 消费 电子 产品 的 革命 。 研 究 并 说 明 闪 存 如 何 工 

作 。 使 用 图 说 明 浮 空门 。 描 述 如 何 编程 存储 器 中 的 位 。 正 确 注 明 引用 的 资料 。 

一 个 地 球 外 生命 项 目 小 组 刚 发 现 有 外 星人 生活 在 Mono 湖 的 底部 。 需 要 设计 一 个 电路 来 

判断 外 星人 来 自 哪 个 可 能 的 星球 ， 基 于 NASA 探测 器 获得 它们 的 外 形 ( 绿 色 、 褐 色 、 黏 

稠 的 、 丑 的 ) 。 仔 细 研 究 宇 宙 生 物 学 后 ， 以 得 出 以 下 绪论 : 

o 如 果 外 星人 是 绿色 的 且 黏稠 的 或 者 丑陋 的 ， 褐 色 且 黏稠 的 ， 则 它 可 能 来 自 火 星 。 

o 如 果 这 个 生物 是 丑 的 、 褐 色 的 且 黏 稠 的 ， 或 者 绿色 的 但 不 黏稠 且 不 丑陋 ， 那 么 它 可 能 
来 目 金星 。 

e 如 果 它 是 褐色 的 且 既 不 是 黏稠 又 不 丑陋 ， 或 者 绿色 的 且 黏 稠 的 ， 则 它 可 能 来 自 木 星 。 
注意 可 能 产生 并 不 唯一 的 结果 。 例 如 ， 一 个 生命 形式 挫 杂 了 绿色 和 褐色 ， 是 黏稠 的 但 
不 丑陋 的 ， 则 可 能 来 自 火 星 或 者 木星 。 

(a) 编写 一 个 4 x4 x3 的 PLA 程序 来 识别 外 星人 。 你 可 能 要 用 到 点 表示 法 。 

(b) 编写 一 个 16 x3 的 ROM 来 识别 外 星人 。 你 可 能 要 用 到 点 表示 法 。 

(c) 用 HDL 实现 你 的 设计 。 

使 用 一 个 单独 的 16 x3 ROM 实现 以 下 的 函数 。 使 用 点 表示 法 说 明 ROM 的 内 容 。 

(a) X=AB+BCD+AB 

(b) Y=AB + BD 


5. 55 
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(c) Z=A+B+C+D 

使 用 4 x8 x3 PLA 实现 习题 5. 51 的 函数 。 你 可 能 要 用 到 点 表示 法 。 

说 明 对 以 下 每 个 组 合 电 路 编程 时 需要 的 ROM 容量 。 使 用 ROM 实现 这 些 功能 是 一 个 好 的 
选择 吗 ? 解释 为 什么 。 

(a) 市 C 和 CC 的 16 位 加 法 器 /减法 器 。 

(b) 8x8 乘法 器 。 

(c) 16 位 优先 级 译 码 器 (参见 习题 2. 36). 

考虑 图 5-65 的 ROM 电路 。 对 于 每 一 行 ， 是 否 可 以 对 第 开 列 中 的 ROM 适当 编程 后 实现 
与 第 I 列 电 路 相同 的 功能 ? 





图 5-65 ROM 电路 


对 于 以 下 图 数 ， 需 要 多 少 Cyclone IV FPGA LE 实现 ? 说 明 如 何 配置 一 个 或 多 个 LE 来 实 
现 该 函数 。 应 该 通过 观察 完成 ， 0 AS Se SRE a et b 
(a) 习题 2. 13(c) 中 的 组 合 函 数 。 

(b) JM 2.17(c) PAA BR. 

(c) 习题 2. 24 中 的 2 输出 函数 。 

(d) 习题 2.35 中 的 函数 。 

(e) 4 输入 优先 级 译 码 器 (人 参见 习题 2. 36) 。 

对 于 以 下 函数 ， 重 复习 题 5. 55。 

(a) 8 输入 优先 级 译 码 器 (参见 习题 2. 36), 

(b) 3:8 译 码 器 。 

(ce) 4 位 进位 传播 加 法 器 (没有 进位 输出 或 者 进位 输入 ) 。 
(d) 习题 3.22 的 FSM。 

(e) 习题 3. 27 PRR BIH RA. 


5.57 考虑 图 5-58 中 的 Cyclone IVLE。 它 的 时 间 参 数 在 表 5-5 中 给 出 。 


180 第 5 章 


(a) 图 3-26 的 FSM 需要 最 少 多 少 个 Cyclone IVLE 来 实现 。 
(b) 不 计算 时 钟 偏 移 ， 这 个 FSM 可 靠 运 行 的 最 快 时 钟 频率 是 多 少 ? 
(c) 当时 钟 偏 移 是 3ns 时 ， 这 个 FSM 可 靠 运 行 的 最 快 时 钟 频 率 是 多 少 ? 


表 5-5 Cyclone IV 时 间 参 数 


名 称 值 (ps) 名 称 值 (ps) 
teq? ecg 199 tna ( 每 个 LE) 381 
t setup 76 twire ( LE 之 间 ) 246 
thold 0 TN 0 


5.58 重复 习题 5.57， 解 答 图 3-31b 中 FSM 的 相关 问题 。 

5. 59 ”你 需要 使 用 FPGA 来 实现 一 个 M&M 的 分 类 器 。 用 颜色 传感器 和 发 动机 把 红色 的 糖 放 在 

一 个 饶 里 ， 把 绿色 的 糖 放 在 另 一 个 饶 里 。 这 个 设计 用 Cyclone IV FPGA 芯片 实现 FSM, 

, FPGA 的 时 间 参 数 在 表 5-5 中 给 出 。 如 果 和 希望 FSM 以 100MHz 运行 ， 那 么 其 关键 路 径 上 
222 的 LE 最 多 有 多 少 个 ? FSM 可 以 运行 的 最 快速 度 是 多 少 ? 


面试 问题 

下 述 问题 在 数字 设计 工作 的 面试 曾经 被 问 到 。 

5.1 两 个 无 符号 入 位 数 相 乘 的 最 大 可 能 结果 是 多 少 ? 

5.2 二 进 制 编码 的 十 进 制 (Binary Coded Decimal，BCD) 使 用 4 位 编码 每 一 个 十 进 制 数 。 例 如 ， 
42 o FH 01000010im 表 示 。 为 什么 处 理 器 会 使 用 BCD? 

5.3 设计 硬件 把 两 个 8 位 无 符号 BCD 数 相 加 (参见 问题 5.2) 。 给 出 你 设计 的 电路 图 ,为 BCD 
加 法 器 编写 一 个 HDL BER, 输入 是 4、B 和 Ca, MSE S 和 Cuo Cal C 是 1 位 进位 ， 

A、B 和 S 是 8 位 BCD 数 。 
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6.1 引言 


前 面 章 节 介 绍 了 数字 电路 设计 原理 ， 并 设计 了 一 些 模块 。 在 本 章 
中 ， 我 们 将 进入 新 的 抽象 层次 来 定义 计算 机 的 体系 结构 (architecture ) 。 
体系 结构 是 程序 员 所 见 到 的 计算 机 ， 它 由 指令 集 ( 汇 编 语言 ) 和 操作 数 
地 址 (operand location) ( 寄存器 和 存储 器 ) 来 定义 。 现 在 有 不 同类 型 的 
体系 结构 ， 例 如 x86、MIPS、SPARC 和 PowerPC 等 。 

理解 任何 计算 机 体系 结构 的 第 一 步 是 学 习 它 的 语言 。 计 算 机 语言 
中 的 单词 叫 作 指令 (instruction ) 。 计 算 机 的 词汇 表 叫 作 指 令 集 (instruc- ”| 微 体系 结构 
tion set) 。 在 同一 个 计算 机 上 运行 的 所 有 程序 使 用 相同 的 指令 集 。 即 使 — 
非常 复杂 的 软件 应 用 程序 (如 字 处 理 软件 或 电子 表格 软件 ) 也 最 终 编 译 
为 一 系列 诸如 加 法 、 减 法 或 跳 转 的 简单 指令 。 计 算 机 指令 包含 需要 完 ; 


数 来 自 存储 器 、 寄 存 器 或 者 指令 自身 。 
计算 机 硬件 只 能 理解 二 进 制 信息 ， 所 以 指令 也 编码 为 二 进 制 数 ， 
其 格式 称 为 机 器 语言 (machine language) 。 正 如 使 用 字母 来 编码 人 类 的 


语言 一 样 ， 计 算 机 使 用 二 进 制 数 编码 机 器 语言 。 微 处 理 器 是 一 个 可 以 
读 并 执行 机 融 语 言 指 令 的 数字 系统 。 因 为 人 类 直接 阅读 二 进 制 格式 的 
机 器 声言 会 非常 枯燥 而 乏味 ， 所 以 使 用 符号 格式 来 表示 指令 ， 称 为 汇 
编 语 言 (assemble language ) 。 

不 同体 系 结构 的 指令 集 更 像 不 同 的 方言 ， 而 不 是 不 同 的 语言 。 几 乎 所 有 的 体系 结构 都 定义 
了 基本 指令 ,例如 加 法 、 减 法 和 跳 转 ， 对 存储 器 或 寄存 器 进行 操作 。 一 旦 学 习 了 一 个 指令 集 ， 
理解 其 他 指令 集 就 相当 简单 。 

计算 机 体系 结构 没有 定义 底层 的 硬件 实现 。 通 常 ， 一 个 计算 机 体系 结构 有 不 同 的 硬件 实 
现 。 例 如 ，Intel 公司 和 AMD( Advanced Micro Devices) 公 司 销售 的 不 同 处 理 器 都 属于 相同 的 x86 
体系 结构 。 它 们 可 以 运行 相同 的 程序 ， 但 是 它们 使 用 不 同 的 底层 硬件 实现 ， 因 此 可 以 提供 在 价 
- 格 、 性 能 和 功 耗 等 方面 的 各 种 折 中 。 有 些 处 理 器 专门 对 高 性 能 服务 器 进行 优化 ， 而 其 他 处 理 需 
可 能 为 了 延长 笔记 本 计算 机 的 电池 寿命 而 针对 功 耗 进行 优化 。 寄 存 器 、 存 储 器 、ALU 和 其 他 模 
块 形成 微 处 理 器 的 特定 方式 称 为 微 体系 结构 (microarchitecture) ， 将 在 第 7 章 中 讨论 这 个 主题 。 
经 常 有 针对 同一 体系 结构 的 不 同 微 体系 结构 设计 。 

在 本 书 中 ， 我 们 将 介绍 John Hennessy 和 他 的 同事 于 20 世纪 80 年 代 在 Stanford 大 学 首先 提 
出 的 MIPS 体系 结构 。MIPS 处 理 器 得 到 了 广泛 的 应 用 ， 例 如 Silicon Graphics, Nintendo 和 Cisco 
等 公司 都 采用 了 这 种 处 理 器 。 我 们 将 从 基本 指令 、 操 作 数 地 址 和 机 器 语言 格式 开始 介绍 ， 随 后 
介绍 在 常用 程序 结构 (包括 分 支 、 循 环 、 数 组 操作 和 函数 调用 ) 中 使 用 的 指令 序列 。 

通过 本 章 ， 我 们 将 看 到 由 Patterson 和 Hennessy 提出 的 MIPS 体系 结构 设计 的 4 个 准则 : 1) 简 
单 设计 有 助 于 规整 化 ; 2) 加 快 常 见 功能 ; 3) 越 小 的 设计 越 快 ; 4) 好 的 设计 需要 好 的 折 中 方法 。 
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6.2 汇编 语言 

汇编 语言 是 计算 机 机 器 语言 的 人 类 可 阅读 表示 。 每 条 汇编 语言 指令 都 指明 了 需要 完成 的 操 
作 和 操作 所 处 理 的 操作 数 。 介 绍 简单 的 算术 指令 并 说 明 ， 如 何 用 汇编 语言 编写 这 些 操作 。 然 后 
定义 MIPS 指令 操作 数 : 寄存 硕 、 存 储 希 和 第 数 。 

假设 你 已 经 熟悉 一 种 高 级 程序 语言 ， 如 C、C ++ 或 Java( 实 际 上 ， 这 些 语 言 在 本 草 的 例子 
中 都 几乎 差不多 ， 但 它们 不 同 的 地 方 ， 我 们 将 使 用 C 语言 ) 。 附 录 C 为 那些 具有 较 少 或 者 没有 
编程 经 验 的 读者 提供 语言 介绍 。 


6. 2.1 指令 


最 常见 的 计算 操作 是 加 法 。 代 码 示例 6. 1 给 出 了 如 何 将 两 个 变量 b 和 c 相 加 并 将 结果 写 人 
a 中 。 左 边 是 高 级 语言 (C、C ++ 或 Java) ， 右边 使 用 MIPS 汇编 语言 重 写 。 注 意 C 语言 程序 语 
句 的 最 后 是 一 个 分 号 。 


代码 示例 6.1 加 法 
高 级 语言 代码 MIPS 汇编 代码 


a=b+c; add a, b,c 


代码 示例 6. 2 减法 
高 级 语言 代码 MIPS 汇编 代码 


a= bD- c} suba, b,c 


汇编 指令 的 第 一 部 分 add 是 助 记 符 ( mnemonic)， 它 指明 需要 执行 的 操作 。 该 操作 基于 源 
操作 数 ( source operand)b 和 c， 将 结果 写 入 目的 操作 数 ( destination operand) a, 
代码 示例 6. 2 说 明 减 法 指令 类 似 于 加 法 。 除 了 操作 码 sub 以 外 ， 指 令 格式 完全 与 加 法 指令 
相同 。 这 种 一 致 的 指令 格式 很 好 地 证 明了 第 一 个 设计 准则 : 
设计 准则 1: 简单 设计 有 助 于 规整 化 。 
指令 中 包含 固定 数目 的 操作 数 ( 在 本 例 中 ， 有 2 个 源 操 作 数 和 一 个 目的 操作 数 ) 将 易于 编码 
和 硬件 处 理 。 更 复杂 的 高 级 语言 代码 可 以 转化 为 多 条 MIPS 指令 ， 如 代码 示例 6. 3 所 示 。 


代码 示例 6. 3 ”复杂 代码 
高 级 语言 代码 MIPS 汇编 代码 


a=b+c-d; // single-line comment subt, c, d #t=c-d 


/* multiple-line adda, B, t #a=b+t 
comment */ 


在 高 级 语言 例子 中 ， 单 行 注释 以 // 开 始 直 到 一 行 结束 ， 多 行 注 释 则 由 A/* 开始 且 由 */ 结 
束 。 在 汇编 语言 中 仅仅 支持 单行 注释 ， 由 # 开 始 直 到 一 行 结束 。 代 码 示 例 6.3 中 的 汇编 语言 
序 需要 一 个 临时 变量 七 来 存储 中 间 结 果 。 使 用 多 条 汇编 指令 执行 复杂 的 操作 体现 了 计算 机 体系 
结构 的 第 二 个 设计 准则 ; 

设计 准则 2: 加 快 常见 功能 。 

MIPS 指令 集 通过 仅仅 包含 简单 、 常 用 指令 使 常见 的 情况 能 较 快 执行 。 指 令 数 比较 少 ， 这 
使 得 用 于 指令 操作 和 操作 数 译 码 的 硬件 比较 简单 、 精 练 和 快捷 。 更 复杂 但 不 常见 的 操作 由 多 条 
简单 指令 序列 执行 。 因 此 ，MIPS 属于 精简 指令 集 计 算 机 ( Reduced Instruction Set Computer, 
RISC) 体系 结构 。 具 有 复杂 指令 的 体系 结构 ， 例 如 Intel x86， 称 为 复杂 指令 集 计算 机 ( Complex 
Instruction Set Computer, CISC), 。 例 如 ，x86 中 定义 的 “字符 串 移动 ”指令 将 字符 串 从 内 存 的 一 
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个 位 置 复 制 到 男 一 个 位 置 。 这 样 的 操作 需要 很 多 条 ( 很 可 能 上 百 条 ) RISC 机 器 的 简单 指令 。 然 
m, CISC 体系 结构 中 实现 复杂 指令 的 成 本 在 于 增加 了 硬件 而 且 降低 了 简单 指令 的 执行 速度 。 

RISC 体系 结构 在 降低 硬件 复杂 性 的 同时 ， 还 使 得 在 指令 编码 中 区 分 不 同 操作 的 位 数 比 较 
少 。 例如， 有 64 条 简单 指令 的 指令 集 需要 log,64 =6 位 来 编码 每 个 操作 。 有 256 条 复杂 指令 的 
指令 集 需 要 log,256 = 8 位 来 编码 每 条 指令 。 在 CISC 处 理 器 中 ， 即 使 复杂 指令 使 用 的 频率 非常 
小 ， 它 们 也 将 增加 包括 简单 指令 在 内 的 所 有 指令 的 开销 。 


6.2.2 操作 数 : 寄存 器 、 存 储 器 和 常数 


一 条 指令 的 操作 需要 基于 操作 数 。 在 代码 示例 6. 1 中 变量 a、b、c 都 是 操作 数 。 但 是 计算 
机 只 能 处 理 二 进 制 ， 而 不 能 处 理 变量 名 。 指 令 需 要 从 一 个 物理 位 置 中 取出 二 进 制 数据 。 操 作 数 
可 以 存放 在 寄存 器 或 存储 器 中 ， 也 可 以 作为 常数 存储 在 指令 自身 中 。 计 算 机 使 用 不 同 的 位 置 存 
放 操 作 数 以 便 优化 性 能 和 存储 容量 。 访 问 存放 在 指令 中 的 常数 或 者 寄存 器 中 的 操作 数 非 常 快 ， 
但 是 它们 只 能 包含 少量 数据 。 更 多 的 数据 需要 访问 存储 器 得 到 。 存 储 器 虽然 容量 大 ， 但 是 访问 
速度 比较 慢 。 因 为 MIPS 体系 结构 对 32 位 数据 进行 操作 ， 所 以 称 为 32 位 体系 结构 (MIPS 体系 
结构 的 商业 产品 已 经 扩展 到 64 位 ， 但 是 本 书 仅仅 考虑 32 位 格式 ) 。 ， 

1. 寄存 器 | 

只 有 快速 访问 操作 数 ， 指 令 才 能 快速 执行 。 但 是 存放 在 存储 器 中 的 操作 数 需 要 较 长 时 间 才 
能 访问 到 。 因 此 ， 大 多 数 体 系 结构 定义 了 几 个 寄存 器 用 于 存放 常用 的 操作 数 。MIPS 体系 结构 
有 32 个 寄存 器 ， 称 为 寄存 器 集 (register set ) 或 寄存 器 文件 (register fle) 。 寄 存 器 越 少 访问 速度 
越 快 ， 这 正 验证 了 第 三 个 设计 准则 : 

设计 准则 3: 越 小 的 设计 越 快 。 

从 书桌 上 少量 相关 的 书籍 中 查找 信息 比 从 图 书馆 的 书库 中 查找 快 很 多 。 同 样 ， 从 比较 少 的 
寄存 器 (例如 32 个 ) 中 读 取 数据 比 从 1000 个 寄存 器 或 大 存储 器 中 读 取 数据 快 。 小 寄存 器 文件 往 
往 用 小 SRAM 阵列 (参见 5.5.3 节 ) 创 构 。 这 样 的 SRAM 阵列 使 用 小 译 码 器 和 位 线 连接 到 相对 少 
的 存储 单元 ， 所 以 与 大 的 存储 器 相 比 它 具有 更 短 的 关键 路 径 。 

代码 示例 6.4 显示 了 具有 寄存 器 操作 数 的 add 指令 。MIPS 寄存 器 名 由 $ 符 号 开始 。 变 量 
a, b 和 cc 存放 在 $s0、S$sl 和 $s2 中 。( $sl 读 作 “Register sl1” 或 “dollar sl1”)。 指 令 将 对 
$sl (b) 和 $s2 (c) 中 存储 的 32 位 数据 相 加 ， 并 将 32 位 结果 写 人 $s0 (a)。 

MIPS 有 32 个 寄存 器 ， 其 中 使 用 18 个 寄存 器 存储 变量 $s0 ~ $s7 和 St0 ~ St9。 由 $s FF 
头 的 寄存 器 称 为 保存 寄存 器 (saved register) 。 根 据 MIPS 的 惯例 ， 这 些 寄 存 器 存储 请 如 a、b、c 
等 变量 。 保 存 寄存 器 的 一 个 特殊 用 途 是 用 于 也 数 调用 (参见 6.4.6 节 )。 以 St 开头 的 寄存 器 称 
为 临时 寄存 器 (temporary resister) ， 用 于 存储 临时 变量 。 代 码 示 例 6.5 说 明 MIPS 汇编 代码 使 用 
临时 寄存 器 St0 来 存储 c ~ da 的 中 间 结 果 。 


代码 示例 6.4 ”寄存 器 操作 数 
高 级 语言 代码 MIPS 汇编 代码 


a=b+c; #$sO=a,. $51=b, $52=c 
add $50, $51, $s2 #a=b+c 


代码 示例 6. 5 临时 寄存 器 
高 级 语言 代码 MIPS 汇编 代码 
a=b+c-d; #$sO=a, $sl=b, $s2=c, $s3=d 


sub $t0, $s2, $53 #t=c-d 
add $s0, $sl, $t0 #a=b+t 
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高 级 语言 代码 转换 为 汇编 语言 代码 


je OF 


将 以 下 高 级 语言 代码 转换 为 汇编 语言 代码 。 假 设 变 量 a ~ c 存储 在 寄存 器 $s0 ~ $s2 中 ， 


而 变量 £ ~ j 则 存储 在 寄存 器 $s3 ~ $s7 中 。 


& =D- C3 
f=(g+h)—-—(i+j); 


解 : 该 程序 使 用 4 条 汇编 语言 指令 。 


# MIPS assembly code 
#$sO=a, $s1 =b, $s2=c, $s3=f, $s4=g, $s5=h 
# $s6 =i, $s7=j 

sub $s0, $s1, $s2 #a=b-c 

add $t0, $s4, $s5 #$tO=g+h 

add $tl1, $s6, $57 #$tl=i+j 

sub $53, $t0, $t1 #f=(g+h) - (i+j) 


2. 寄存 器 集 


< 


MIPS 体系 结构 定义 了 32 个 寄存 器 。 每 个 寄存 器 都 有 一 个 名 字 和 从 0 ~ 31 的 编号 。 表 6-1 
给 出 了 寄存 器 的 名 字 、 编 号 和 用 途 。 $0 始终 为 0， 因 为 常数 0 经 常 在 计算 机 程序 中 使 用 。 我 
们 已 经 讨论 了 $s 和 st 寄存 器 ， 其 余 的 寄存 器 将 在 本 章 的 后 续 内 容 中 介绍 。 


表 6-1 MIPS 寄存 器 集 


名 字 编号 用 途 名 字 
$0 0 常数 0 $t8 ~ $t9 
$at l 汇编 器 临时 变量 $k0 ~ $k1 
$v0 ~ $v1 2~3 函数 返回 值 Sgp 
$a0 ~ $a3 4~7 PAS AX $sp 
St0 ~ $t7 8 ~15 临时 变量 Sfp 
$s0 ~ $s7 16 ~23 保存 变量 $ra 

3. 存储 器 


编号 
24 ~ 25 
26 ~27 
28 
29 
30 
31 


用 途 
临时 变量 
操作 系统 临时 变量 
全 局 指针 
栈 指针 
帧 指针 
函数 返回 地 址 


如 果 仅 仅 以 寄存 器 作为 操作 数 的 存储 空间 ， 那 么 将 限制 程序 中 的 变量 不 能 超过 32 个 。 但 
是 ， 数 据 也 可 以 存储 在 存储 器 中 。 与 寄存 器 文件 相 比 ， 存 储 器 可 以 存储 更 多 的 数据 ， 但 是 访问 
数据 的 时 间 就 更 长 。 寄 存 器 容量 小 且 速 度 快 ， 而 存储 器 容量 大 且 速 度 慢 。 所 以 ， 经 常 使 用 的 变 
量 保存 在 寄存 器 中 。 通 过 综合 使 用 寄存 器 和 存储 器 ， 程 序 可 以 以 相对 较 快 的 速度 访问 大 量 的 数 
据 。 如 5.5 节 所 述 ， 存 储 器 组 织 为 数据 字 的 阵列 。MIPS 体系 结构 采用 32 位 存储 器 地 址 和 32 位 


数据 字 长 。 


MIPS 采用 字 节 寻 址 存储 器 。 也 就 是 说 ， 存 储 锅 中 的 每 一 字 节 都 有 一 个 单独 的 地 址 。 然 而 ， 
为 了 便于 理解 ， 本 节 首 先 讲解 字 寻 址 存储 器， 然后 再 讲述 MIPS 的 字 节 寻 址 存储 器 。 
图 6-1 给 出 了 字 寻 址 (word-addressable) 存 储 器 阵列 。 也 就 是 说 ， 每 32 位 数据 字 对 应 一 个 唯 


一 的 32 位 地 址 ， 其 中 32 位 地 址 和 32 位 数据 值 用 16 进 制 表 
示 。 例 如 ， 数 据 0XF2F1AC07 存储 在 存储 器 地 址 1 中 。 十 六 进 
制 常 数 书 写 时 以 OX 为 前 缀 。 按 照 惯 例 ， 图 中 的 存储 器 低地 址 
在 下 ， 高 地 址 在 上 。 

MIPS {EHA F (load word) 指 令 lw 将 存储 器 中 读 出 的 数据 
装 人 寄存 器 中 ， 代 码 示 例 6. 6 说 明 如 何 将 存储 器 字 1 装 入 $s3 中 。 

lw 指令 指定 内 存 有 效 地 址 (effective address ) 为 基地 址 
(base address ) 与 偏 移 量 (offset) 的 和 。 基 地 址 为 寄存 器 ， 写 在 


字 地 址 


00000003 
00000002 
00000001 
00000000 


数据 






MEERE ES 
ETE ES 
F2F1 Aco Fi 
AB CDEF7 4] #0 


图 6-1 FAWR ARAE A 
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括号 内 。 偏 移 量 是 一 个 常数 ， 写 在 括号 前 面 。 在 代码 示例 6.6 中 ， 基 地 址 是 总 是 值 为 0 的 $0， 
偏 移 量 是 1， 所 以 lw 指令 从 存储 器 中 读 出 的 地 址 为 ( $0 +1) =1。 在 1w 指令 执行 之 后 ， $s3 
中 的 值 为 0XF2F1AC07， 此 值 就 是 图 6-1 存储 器 地 址 中 1 所 存储 的 值 。 


代码 示例 6.6 读 字 寻 址 存储 器 


汇编 代码 
# This assembly code (unlike MIPS) assumes word-addressable memory 
lw $s3, 1($0) # read memory word 1 into $s3 


类 似 地 ，MIPS 使 用 存储 字 (store word) 指令 sw SAF FF ar lel Fite S BES. Ta Bil 6. 7 
将 寄存 器 $s7 PRIA S A F MarS Po ERKAK $0 作为 基地 址 ， 然 而 任何 寄存 器 
均 可 作为 基地 址 。 


代码 示例 6.7 写字 寻 址 寄存 器 


汇编 代码 
#This assembly code (unlike MIPS) assumes word-addressable memory 
sw $s7, 5($0) # write $s7 to memory word 5 


上 述 两 个 代码 示例 描述 了 字 寻 址 存储 器 的 计算 机 体系 结构 。 然 而 MIPS 存储 器 模型 是 字 节 寻 
址 而 不 是 字 寻 址 。 每 一 个 数据 字 节 都 有 一 个 唯一 的 地 址 。 一 个 32 位 的 字 包 含 4 个 8 位 字 节 ， 所 以 
每 一 个 字 地 址 都 是 4 的 倍数 ， 如 图 6-2 所 示 。 而 且 ，32 位 字 地 址 和 数据 值 都 是 用 16 进 制 表示 的 。 

代码 示例 6. 8 描述 了 如 何在 MIPS 字 节 寻 址 存储 器 中 读 / 写 一 字 。 字 地 址 是 字号 的 4 倍 ，MIPS 
汇编 代码 读 取 第 0、2 和 3 号 字 ， 写 人 第 1、8 和 100 号 字 。 偏 移 量 可 用 10 进 制 和 16 进 制 表示 。 


代码 示例 6.8 访问 字 节 寻 址 存储 器 


MIPS 汇编 代码 

Iw $s0, 0($0) # read data word 0 (OxABCDEF78) into $s0 
lw $sl, 8($0) # read data word 2 (Ox01EE2842) into $s1 
Iw $s2, OxC($0) # read data word 3 (0x40F30788) into $s2 
sw $83, 4($0) # write $s3 to data word 1 

sw $54, 0x20($0) # write $s4 to data word 8 

sw $s5, 400($0) # write $s5 to data word 100 


MIPS 体系 结构 也 提供 了 lb 和 sb 指令 来 装 入 和 存储 单字 节 而 不 是 字 。 这 两 条 指令 与 lw 
和 sw 指令 很 相似 ， 将 在 6. 4.5 节 介 绍 。 

如 图 6-3 所 示 ， 字 节 寻 址 存储 器 的 组 织 方 式 有 大 端 (big-endian) 和 小 端 (little-endian ) 两 种 
形式 。 在 两 种 格式 中 ， 最 高 有 效 字 节 (Most Significant Byte，MSB ) 在 左边 ， 最 低 有 效 字 节 (Least 
Significant Byte，LSB ) 在 右边 。 在 大 端 形 式 的 机 器 中 ， 第 0 个 字 节 在 最 高 有 效 字 节 ; 在 小 端 形 
式 的 机 器 中 ， 第 0 个 字 节 在 最 低 有 效 字 节 。 两 种 格式 的 字 地 址 相同 ， 并 指向 相同 的 4 字 节 。 唯 
一 不 同 的 是 一 个 字 中 字 节 的 地 址 不 同 。 





字 地 址 ， 数据 
i £ 大 端 小 端 
0000000C |4 ojF 3|0 7|8 8| 字 3 , 字 节 地 址 “ 字 地 址 字 节 地 址 
oo000008 [o 1E sl efa 2| #2 Cha ats lh ge SE a? 
00000004 Fi : 
00000000 Fo : 
一 0 
宽度 =4 字 节 MSB LSB MSB LSB 


图 6-2 SLAF MA 图 6-3 大 端 和 小 端 存储 器 寻 址 
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大 端 和 小 端 存储 器 

假设 $s0 最 初 包含 0x23456789。 在 大 端 系统 中 运行 下 列 程序 后 $s0 的 值 为 多 少 ? 如果 在 
小 端 系统 中 呢 ? lb $s0，1 ($0) 将 字 节 地 址 (1 + SO) =1 中 的 数据 装 入 $s0 的 最 低 有 效 字 节 
H, 1b 指令 将 在 6.4. 5 节 中 讨论 。 


sw $s0, 0($0) Ca Kii iii 小 端 a 

š dmb A cF Sl 

解 : 图 6-4 显示 了 大 端 和 小 端 机 器 中 在 存储 oe a ER 

器 字 0 如 何 存储 值 0x23456789。 在 装 入 字 节 指令 图 6-4 大 端 和 小 端 数据 存储 
lb $s0, 1( $0) 执行 后 ， 大 端 系统 中 $s0 中 的 数据 为 0x00000045 ， 而 小 端 系统 中 $s0 中 的 数 
据 为 0x00000067。 < 


IBM PowerPC( 在 Macintosh 计算 机 中 采用 ) 使 用 大 端 寻 址 。Itel x86 体系 结构 (在 PC 机 中 ) 
使 用 小 端 寻 址 。 有 些 MIPS 处 理 器 使 用 小 端 方式 ， 而 另 一 些 使 用 大 端 方式 ?。 选 择 大 端 或 小 端 
方式 完全 是 任意 的 ， 但 因此 引起 了 使 用 大 端 与 小 端 方式 的 计算 机 之 间 共 享 数据 的 麻烦 。 在 本 文 
: | 的 例子 中 ， 在 涉及 字 节 顺序 时 都 使 用 小 端 方式 。 
nt 在 MIPS 体系 结构 中 ，1lw 和 sw 的 字 地 址 必须 是 字 对 齐 (word aligned) 的 ， 即 地 址 必须 能 被 
4 整除 。 所 以 指令 lw $s0,7 ( $0) 是 非法 指令 。 在 有 些 体系 结构 中 (如 x86 ) 允许 读 / 写 非 字 对 
齐 数据 ， 但 在 MIPS 中 ， 为 了 简化 ， 要 求 严格 的 字 对 齐 。 当 然 ， 装 人 字 节 (1b ) 和 存储 字 节 
(sb) 指 令 的 字 节 地 址 ， 不 需要 字 对 齐 。 
4. 常数 /立即 数 , 
装 人 字 (1Lw) 和 存储 字 ( sw) 指令 还 说 明 MIPS 指令 中 常数 (constant) 的 用 法 。 因 为 常数 的 值 
可 以 被 指令 立即 访问 ， 而 不 需要 通过 访问 寄存 右 或 存储 器 来 得 到 ， 所 以 这 些 稼 数 叫 作 立 即 数 
(immediate) 。 加 立即 数 (addi ) 指令 是 一 个 以 立即 数 为 操作 数 的 常见 MIPS S. addi 将 指令 
指定 的 立即 数 与 某 一 寄存 器 中 的 值 相 加 ， 如 代码 示例 6.9 所 示 。 


代码 示例 6.9 立即 数 操作 数 
高 级 语言 代码 MIPS 汇编 代码 


a=at4; # $sO=a, $sl=b 
b 三 8 一 12; addi $50, $s0, 4 失去 三 aa 十 4 
addi $s1, $s0, 一 12 #b=a-12 


指令 中 指定 的 立即 数 采 用 16 位 补 码 表示 ， 范围 在 [ - 32768, ，32767 ]。 减 法 相当 于 加 一 个 
负数 ， 因 此 ， 为 了 简单 起 见 ，MIPS 体系 结构 中 没有 subi HS. 

前 面 提 到 的 add 和 sub 指令 使 用 三 个 寄存 髓 操作 数 。 但 是 ，1w、sw 和 addi 指令 用 两 个 
寄存 器 操作 数 和 一 个 常数 。 因为 指令 格式 的 不 同 ， 所 以 lw 和 sw 指令 违反 了 设计 原则 1: 简单 
设计 有 助 于 规整 化 。 然 而 ， 这 个 问题 我 们 引入 最 后 一 个 设计 准则 ; 

设计 准则 4: 好 的 设计 需要 好 的 折 中 。 

单条 指令 格式 可 能 简洁 但 缺乏 弹性 。MIPS 指令 集 支 持 三 种 指令 格式 。 第 一 种 格式 有 三 个 
寄存 器 操作 数 ， 如 add 和 sub 指令 。 第 二 种 格式 有 两 个 寄存 器 操作 数 和 一 个 16 位 的 立即 数 ， 
如 lw Al addi 指令 。 第 三 种 格式 有 一 个 26 位 的 立即 数 ， 但 没有 寄存 器 操作 数 ， 将 在 后 面 讨论 

它 。 下 一 节 将 讨论 三 种 MIPS 指令 格式 及 其 二 进 制 代码 的 编码 。 


© SPIM， 本 文中 的 MIPS 仿真 器 ， 使 用 其 运行 机 器 的 字 节 序 。 例 如 :， 7E Intel x86 机 器 上 使 用 SPIM 时 ， 内 存 
是 小 端 寻 址 的 ; 而 在 较 旧 的 Macintosh 或 Sun SPARC 上 使 用 时 ， 内 存 是 大 端 寻 址 的 。 
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6.3 机 器 语言 

汇编 语言 方便 人 们 阅读 。 然 而 ， 数 字 电 路 只 能 理解 0 和 1。 因 此 ， 需 要 将 汇编 语言 写 的 程 
序 从 助 记 符号 转换 成 仅 使 用 0 和 1 表示 的 机 器 语言 (machine language) 。 

MIPS 使 用 32 位 指令 。 这 里 再 次 强调 ,简单 设计 有 助 于 规整 化 ， 最 常规 的 选择 是 将 所 有 指 
令 编 码 为 存储 器 中 存储 的 字 。 即 使 有 些 指 令 可 能 不 需要 所 有 32 位 的 编码 ,但 可 变 长 度 指令 将 
增加 太 多 的 复杂 性 。 简 单 化 也 误 励 使 用 单 指令 格式 ,但 是 由 于 上 文 提 到 的 原因 ， 所 以 过 于 简单 
化 将 产生 太 多 限制 。MIPS 做 了 折 中 ， 它 定义 了 3 种 指令 格式 : R 类 型 、I 类 型 和 J 本 类 型 。 少 量 
的 指令 格式 允许 一 些 适用 于 各 种 格式 的 规整 设计 ， 因 此 硬件 可 以 保持 简单 ， 也 可 适用 于 不 同 的 
指令 需要 (例如 ， 需 要 在 指令 中 对 大 常数 编码 ) 。R 类 型 指令 对 3 个 寄存 器 操作 。I 类 型 指令 对 
两 个 寄存 器 和 一 个 16 位 立即 数 操 作 。J 类 型 ( 跳 转 ) 指 令 对 一 个 26 位 的 立即 数 操作 。 本 节 介 绍 
这 3 种 指令 格式 ,但 对 J 类 型 指令 的 讨论 ， 将 放 在 6.4.2 节 中 。 


6.3.1 R 类 型 指令 R 类 型 
mini a” 
R 类 型 是 寄存 器 类 型 (register-type) 的 缩写 。R 类 | op | rs | rt | rd | shame} fonct | 


型 指令 有 3 个 寄存 器 操作 数 : 2 个 为 源 操作 数 ，1 个 为 人 
a DA : | ’ | 
目的 操作 数 。 图 6-5 给 出 了 R 类 型 机 器 指令 格式 。 32 OP RAMIDLE TERA 
位 指令 分 为 6 个 字段 ; op、rs、rt、rd、shamt 和 funct。 每 个 字段 有 包含 5~6 位 。 

指令 的 操作 编码 为 2 个 字段 (以 灰色 显示 ) : op( 也 称 为 opcode 或 操作 码 ) 和 funct( 也 被 
PAPEL). MA R 类 型 指令 的 操作 码 都 是 0， 特 定 R 类 型 操作 由 funt 字段 决定 。 例 如 ， 
add 指令 的 opcode 和 funct 字段 分 别 为 0(000000, ) 和 32(100000, ) 。 类 似 地 ，sub 指令 的 
opcode 和 funct 字段 为 0 和 34。 

指令 的 操作 数 编码 包括 3 个 字段 : rs、rt 和 rd。 前 两 个 寄存 器 rs 和 rt 是 源 寄存 器 。 
rd 是 目的 寄存 器 。 这 些 字 段 包含 了 图 6-1 给 出 的 寄存 器 编号 。 例 如 ， $s0 为 寄存 器 16。 

第 5 个 字段 shamt 仅仅 用 于 移 位 操作 。 在 这 些 指令 中 存储 在 5 位 shamt 字段 中 的 二 进 制 
数值 表示 移 位 数 。 对 于 其 他 R 类 型 指令 ，shamt 为 0。 

图 6-6 给 出 了 R 类 型 指令 add 和 sub 的 机 器 代码 。 注 意 ， 在 汇编 语言 指令 中 ， 目 的 寄存 
器 是 第 一 个 寄存 器 ， 而 在 机 器 语言 指令 中 ， 目 的 寄存 器 为 第 三 个 寄存 器 字段 (rd)。 例 如 ， 汇 
编 指令 add $s0, $s1, $s2 表示 rs= $s1(17)、 rt = $s2(18) 和 rd= $s0(16)。 


汇编 代码 字段 值 机 器 代码 
shamt funct o rd shamt funct 


Di BS ARE ETE.. p rs rt 
aaa sso, so1, se2[ © [17] 18] 16] o | 32 | [oooooofiooo1ŢrooroȚroooo]ooooofiooooo] (ox 02328020 
cup seo, sta, ses Co [u [is f s [o | 36] [ooooooforor oror forooo{ooooofroooro] ox rsbsoa2 
6 位 5 位 5 位 5 位 5 位 6 位 Aw Siu Si Siw Sit 6 位 
图 6-6 R 类 型 指令 的 机 器 码 
对 于 本 书 中 使 用 的 MIPS 指令 ， 附 录 B 中 表 B-1 和 表 B-2 定义 了 所 有 MIPS 指令 的 opcode 
(AA R 类 型 指令 funct 字段 的 值 。 
汇编 语言 转换 为 机 器 语言 
将 下 列 汇编 语言 语句 转换 为 机 人 髓 语言 。 
add $t0, $s4, $s5 
fe: HGRA 6-1, StO, $s4 和 $s5 是 寄存 器 8 20 和 21。 根 据 表 B-1 MA B-2, addH 


306 
’ 
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opcode 为 0，funct 为 32。 各 个 字段 和 机 器 代码 如 图 6-7 所 示 。 写 出 十 六 进 制 机 器 代码 最 简 
单 的 方法 是 ， 首 先 将 它 写 为 二 进 制 ， 然 后 观察 每 4 位 为 一 组 的 数 ， 每 组 数 表示 一 个 十 六 进 制 数 
字 ( 用 灰色 显示 )。 因 此 ， 机 器 语言 指令 为 0x02954020。 


汇编 代码 字段 值 机 器 代码 
rt rd shamt funct op TS rt rd shamt funct 


sao sco. et, ses [o [aoar] s To [> | oho oweeg o x ssa 


6 位 5 位 5 位 5 位 5 位 6 位 0 
图 6-7 例 6.3 中 R 类 型 指令 的 机 器 人 码 a 


6.3.2 1 类 型 指令 


[ 类 型 是 立即 数 类 型 (immediate-type) 的 缩写 。I 类 型 指令 有 两 个 寄存 融 操 作 数 和 一 个 立即 
数 操作 数 。 图 6-8 给 出 了 工 类 型 机 器 指令 格式 。 一 条 32 位 指令 有 4 个 字段 : op、rs、rt 和 
imm。 前 三 个 字段 (op、rs 和 rt) 与 R 类 型 指令 一 样 。imm 字段 代表 一 个 16 位 立即 数 。 
指令 的 操作 由 opcode 字段 决定 (用 灰色 显示 ) 。 Moran 


操作 数 在 xs 、zE 和 imn SAFE. ze 和 inn WA 
fianai OER EER r nk rt HE ER 5 位 sdo o m 


操作 数 。 

图 6-9 给 出 了 一 些 工 类 型 指令 编码 实例 。 记 住 ， 负 立即 数 表示 为 16 位 有 符号 二 进 制 补 码 
数 。 在 汇编 语言 中 ，rt 作为 目的 操作 数 放 在 前 面 ,但 在 机 器 语言 指令 中 ， 它 是 第 二 个 寄存 器 
字段 。 


汇编 代码 FRE 机 器 代码 


addi $s0, 


addi sto, 


; -12 0 
w sez, a250) [asf o [1] 32 | ronori looondlorordhoon0 onoo oono oono] x cone 
001 foro 


sw $81, 0000 0000 0000 0100| (0 x AD310004) 
6 位 5 位 5 位 16 位 6 位 5 位 5 位 16 位 


图 6-9 工 类 型 指令 的 机 器 代码 


I 类 型 汇编 指令 转换 为 机 器 码 
将 下 列 I 类 型 指令 转换 为 机 器 码 。 
lw $53, —24( $54) 


解 : 根据 表 6-1 9 $s3 和 $s4 分 别 为 寄存 器 19 和 20。 表 B-1 给 出 了 lw 的 opcode 为 35。 
rs 指定 了 基地 址 $s4, rt 指定 了 目的 寄存 器 $s3 ， 立 即 数 imm 编码 16 位 偏 移 量 -24。 因 此 ， 
指令 的 字段 和 机 器 代码 如 图 6-10 所 示 。 





汇编 代码 ae 
Iw $53, -24 (984) a e a] oo ong (OxRESSFFE 
6 位 5 位 5 位 16 位 E 8 


图 6-10 工 类 型 指令 的 机 咒 代 和 码 < 
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I 类 型 指令 有 一 个 16 位 立即 数字 段 ， 但 这 个 立即 数 用 于 32 位 操作 中 。 例 如 ，1w 将 16 位 
偏 移 量 与 32 位 源 寄存 器 相 加 。32 位 中 的 高 16 位 应 该 是 什么 呢 ? 对 于 正 立 即 数 ， 前 16 位 为 全 
0， 但 对 于 负 立 即 数 ， 高 16 位 应 该 为 全 1。 在 1.4.6 节 中 ， 它 称 为 符号 扩展 。 通 过 将 符号 位 (最 
高 有 效 位 ) 复 制 到 位 数 的 所 有 高 位 ， 可 以 将 一 个 入 位 补 码 符 号 扩展 为 诸位 数 。 对 二 进 制 补 码 
进行 符号 扩展 并 不 改变 它 的 值 。 

大 多 数 MIPS 指令 对 立即 数 进行 符号 扩展 。 例 如 ,为 了 支持 正 立 即 数 和 人 负 立 即 数 ，addi、 
ls 和 sw 都 进行 了 符号 扩展 。 这 个 规则 有 一 个 例外 : 逻辑 操作 (andi、ori、xori) 将 0 WHE 
高 半 字 中 ， 这 称 为 0 扩展 ， 而 不 是 符 呈 扩展。 逻辑 操作 将 在 6. 4. 1 节 中 讨论 。 


6.3.3 J 类 型 指令 

] 类 型 是 跳 转 类 型 (jump-type) 的 缩写 。 这 种 格式 仅 用 于 跳 转 指令 (参见 6.4.2 节 )。 如 图 6-11 
所 示 ， 这 种 指令 格式 有 一 个 26 位 地 址 操作 数 addr, 与 其 J 类 型 
他 格式 一 样 ,，J 类 型 指令 由 一 个 6 位 opcode 开始 。 剩 下 的 
位 用 于 指定 地 址 addr。 关 于 本 类 型 指令 进一步 的 讨论 可 参 oi 26 位 
见 6.4.2 节 。 图 6-11 J 类 型 指令 格式 


6. 3.4 解释 机 器 语言 代码 


为 了 解释 机 器 语言 ， 必 须 对 32 位 指令 的 每 一 个 字段 进行 解码 。 不 同 的 指令 使 用 不 同 的 格 
式 ， 但 是 所 有 的 指令 都 以 一 个 6 位 的 opcode 字段 开始 。 所 以 ， 开 始 解释 的 最 好 地 方 是 首先 查 
看 opcode。 如 果 是 0， 则 指令 为 R 类 型 ， 否则， 为 1 类 型 或 J 类 型 。 

机 器 语言 转换 为 汇编 语言 

将 下 列 机 器 语言 代码 转换 为 汇编 语言 。 


Ox2237FFF1 
0x02F34022 


fA: 首先 ， 将 指令 转化 为 二 进 制 格式 ， 查 看 6 位 最 高 有 效 位 ， 找 到 它们 的 opcode, 4 
图 6-12 TAS. opcode 决定 怎样 解释 其 余 的 位 。 这 两 条 指令 的 opcode 分 别 是 001000,(8,。) 和 
000000, (01,,)， 说 明 它 们 分 别 是 addi 和 R 类 型 指令 。R 类 型 指令 的 funct 字段 是 100010, 
(340), WHEE sub 指令 。 图 6-12 给 出 了 与 两 个 机 器 指令 等 价 的 汇编 代码 。 
机 器 代码 字段 值 汇编 代码 


op a. 8 imm op rs rt imm 
(0x2237FFF 1) ooge flogo lp 1111111111110001 8) LF [aa el addi $a7.0461,218 
shamt ois op rs rt rd shamt funct 


corn EGR oT To Ts To [x e 0, or. oo: 


图 6-12 ”机 器 代码 与 汇编 代码 的 互 译 | 


6. 3.5 存储 程序 

用 机 器 语言 编写 的 程序 是 一 个 表示 指令 的 一 系列 32 位 数 。 与 其 他 二 进 制 数 一 样 ， 这 些 指 
令 存 储 在 存储 器 中 。 这 就 是 存储 程序 (stored program) 的 概念 ， 也 是 计算 机 如 此 强大 的 一 个 关键 
原因 。 运 行 一 个 新 的 程序 不 需要 花费 大 量 的 时 间 和 精力 对 硬件 进行 重新 装配 或 重新 布线 ， 只 需 
要 将 一 个 新 的 程序 写 人 存储 器 中 。 存 储 程序 提供 了 通用 (general purpose ) 计算 能 力 ， 而 不 是 特 
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定 的 硬件 。 在 这 种 方式 下 ， 计 算 机 只 是 改变 存储 程序 就 可 以 运行 计算 器 、 文 字 处 理 程序 、 影 音 
播放 器 等 多 种 应 用 程序 。 

存储 程序 中 的 指令 从 存储 器 中 检索 或 取出 (fetch) ， 由 处 理 器 执行 。 即 使 大 型 复杂 程序 也 可 
以 简化 为 一 系列 存储 器 读 和 指令 执行 。 

图 6-13 显示 了 机 器 指令 是 怎样 存储 在 存储 器 中 的 。 在 MPIS 程序 中 ， 指 令 一 般 从 地 址 
0x00400000 开始 存储 。 记 住 ，MIPS 存储 器 地 址 是 字 节 寻 址 ， 所 以 32 位 (4 字 节 ) 指 令 地 址 每 次 
增加 4 字 节 而 不 是 1 字 节 。 


汇编 代码 机 器 代码 存储 程序 
lw $t2, 32($0) 0x8C0A0020 地 址 指令 
add $s0, $s1, $s2 0x02328020 i s 
addi $t0, $s3, -12 0x2268FFF4 7 x 


sub $t0, $t3, $t5 0x016D4022 0040000C |0 16D4022 
00400008 |2268FFF4 


00400004 Ors aoe 8 2 0 
00400000 8 COA0020 





图 6-13 存储 程序 


为 了 运行 或 执行 (execute) 存储 程序 时 ， 处 理 器 从 存储 器 中 顺序 地 取出 指令 。 然 后 ， 数 字 电 
路 硬件 解码 和 执行 这 些 取出 的 指令 。 当 前 指令 的 地 址 存储 在 一 个 称 为 程序 计数 器 (Program 
Counter, PC) 的 32 位 寄存 器 中 。PC 并 不 在 表 6-1 所 示 的 32 个 寄存 器 中 。 

为 了 运行 图 6-13 所 示 的 程序 ， 操 作 系 统 将 PC 的 值 设 为 地 址 0x00400000。 处 理 右 将 这 个 存 
储 器 地 址 的 指令 读 出 ， 并 执行 指令 0x8C0A0020。 然 后 ， 处 理 器 将 PC 增加 4， 变 为 0x00400004， 
接着 取出 并 执行 该 地 址 的 指令 ， 重复 执 行 上 述 过 程 。 

微 处 理 器 的 体系 结构 状态 ( architectural state) 保 存 程序 的 状态 。 对 于 MIPS， 体 系 结构 状态 
由 寄存 器 文件 和 PC 组 成 。 如 果 操 作 系统 在 程序 运行 的 某 个 时 刻 保存 了 体系 结构 状态 ， 那 么 就 
可 以 中 断 该 程序 ， 做 其 他 事情 ， 然 后 恢复 该 状态 ， 使 得 被 中 断 的 程序 又 能 够 继续 正确 执行 ， 而 
不 知道 它 曾经 被 中 断 过 。 在 第 7 章 创建 一 微 处 理 器 时 ， 体 系 结构 状态 也 十 分 重要 。 


6.4 编程 


软件 编程 语言 (如 C a Java) 称 为 高 级 编程 语言 ， 因 为 它们 比 汇编 语言 的 抽象 层次 更 高 。 许 
多 高 级 语言 使 用 算术 和 逻辑 操作 、if/else WA, for 和 while 循环、 数组 下 标 和 上 男 数 调用 
等 常见 的 软件 结构 。 本 节 将 探讨 如 何 将 这 些 高 级 语言 结构 转换 为 MIPS 汇编 代码 。 


6.4.1 算术 /逻辑 指令 

MIPS 体系 结构 定义 了 大 量 的 算术 和 逻辑 指令 。 这 些 指令 对 实现 高 级 语言 结构 是 必需 的 ， 
因此 首先 简要 介绍 它们 。 

1. 逻辑 指令 

MIPS 逻辑 操作 包括 and, or, xor 和 nor。 这 些 R 类 型 指令 对 两 个 源 寄存 器 和 一 个 目的 
寄存 器 进行 按 位 操作 。 图 6-14 给 出 了 源 操作 数 分 别 为 0xFFF0000 和 0x46A1F0B7 的 操作 示例 。 
如 图 6-14 所 示 ， 指 令 执 行 后 结果 存储 在 目的 寄存 器 rd 中 。 
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源 寄 存 器 
ss [TTT 1o00 0000000070000 
sa [poo ono]roro]oo01 rrn ooo ron form 

汇编 代码 结 
ana $53, sst, ss2 ss [O00[orrolorolooor [oo00lo000[o000o000 
or ssa, ssi, se Sst [mmmlralamlooool or lor 
xor $05, sel $82 sss fromfroni[onor] 11101111000) on on 
sor $86, $81, $32 $36 [pooo [ooo] 000000 foo) 11 foroo] 1000" 


图 6-14 ”逻辑 操作 


and 指令 可 用 于 屏蔽 (mask ) 位 (将 不 用 的 位 设置 为 0)。 例 如 ， 在 图 6- 14 中 0xFFF0000 
AND 0x46A1F0B7 =0x46A10000, and 指令 屏蔽 了 最 低 两 个 字 节 ， 并 将 $s3 中 未 被 屏蔽 的 高 两 
个 字 节 0x46Al BFA $s3 中 。 寄 存 顺 位 的 任何 子 集 都 可 以 被 屏蔽 。 

or 指令 可 用 于 组 合 来 自 两 个 寄存 器 的 位 。 例 如 ，0x347A0000 OR 0x00072FC =0x347A72FC, 
即将 两 个 值 组 合 起 来 。 

MPIS 不 提供 NOT 指令 , 但 A NOR $0 =NOT A。 因 此 ，NOR 指令 可 以 代替 NOT 指 

andi, ori Ml xori 指令 也 可 以 对 立即 数 进行 逻 辑 操 作 。MIPS 不 提供 nori ee 因为 

它 的 功能 可 以 用 其 他 指令 轻松 实现 。 习 题 6. 16 将 研究 这 个 问题 。 图 6-15 给 出 了 andi, ori 

和 zori 指令 的 示例 。 图 中 给 出 了 源 寄存 器 和 立即 数 的 值 ， 同 时 也 给 出 了 指令 执行 后 目的 寄存 
4 rt 的 值 。 





源 寄存 器 
ss [p000 oo00fo000|oo00 ooo] ooo rr [ii 
tt [no [oom oo ono] nfo [oroo 





汇编 代码 


andi $s2, $s1, OxFA34 $s2 || fo 70 
ori $83, $s1, OxPA34 $s3 [00000000] 000000001111] 1010/1111] 1111 
zomin Sed. Bada EC 


图 6-15 带 有 立即 数 的 逻辑 操作 


2. 移 位 指令 

移 位 指令 可 将 寄存 右 中 的 值 左 移 或 右 移 最 多 31 位 。 移 位 操作 可 将 操作 数 乘 或 除 以 2 的 整数 次 
Fko MIPS 移 位 操作 包括 逻辑 左 移 指 令 (s11) 、 逻 辑 右 移 指 令 ( sr1) 和 算术 右 移 指令 (sra)。 

在 5.2.5 节 的 讨论 中 , 左 移 一 般 将 低位 补 0。 但 右 移 可 以 是 逻辑 右 移 (高 位 补 0) 或 算术 右 
移 (高 位 补 符号 位 ) 。 图 6-16 给 出 了 R 类 型 指令 sll, srl 和 sra 的 机 器 代码 。 zt( 此 例 中 的 
$s1 ) 保 存 了 行 移 位 32 位 值 ，shamt 给 出 了 移 位 的 位 数 (4) 。 移 位 的 结果 存放 在 rd 中 。 


汇编 代码 字段 值 eae 
rt rd shamt funct shamt ‘funct 


en [orooa ooo feoeo 
ee 
000000|00000 10001 |10011 | 00100 [00001 1 


6 位 5 位 5 位 5 位 5 位 6 位 6 位 5 位 5 位 5 位 5 位 6 位 
图 6-16 移 位 指令 的 机 器 代码 






(0x00114100) 
(0x001 19102) 
(0x00119903) 


sli $t0, QSL, 





srl $s2, $sl, 






sra $s3, $sl, 
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6-17 给 出 了 移 位 指令 srl, slr 和 sra 的 寄存 器 值 。 如 5.2.5 节 所 讨论 的 ， 将 一 个 值 
左 移 N 位 相当 于 乘 以 2"。 同 理 , 算术 右 移 NN 位 ， 相 当 于 除 以 2 。 


源 寄存 器 
ss1 [1111|0011|0000|0000|ooo00|o010| 1010| 1000 
shamt 00100 
汇编 代码 结果 
s11 $to, $s1, 4 sw [oor [ooooloooolooo0loorl 1010] r000] 0000 
cri 52, Sea 4 ss [ooo 1111] 011000) 000 oo foio] 1010 
sra $53, se1, 4 ssa [1111}1111[0011] 000] 000 o000fo0r0[ 1010 


图 6-17 移 位 操作 


MIPS 也 提供 可 变 移 位 指令 : 可 变 逻 辑 左 移 指 令 (sLLv)、 可 变 逻 辑 右 移 指令 (srlv) 和 可 
变 算术 右 移 指 令 (srav)。 图 6-18 给 出 了 这 些 指令 的 机 器 人 代码。 变量 移 位 的 汇编 指令 是 这 样 的 
格式 : sllv rd, rt, rs. rt 和 rs 的 顺序 跟 大 多 数 R 类 型 指令 相反 。rt( 此 例 中 的 $s1 ) 保存 
待 移 位 的 值 。rs( 此 例 中 的 $s2 ) 的 低 5 位 给 出 了 位 移 的 位 数 。 与 前 面 一 样 ， 移 位 的 结果 存放 
在 rd 中 。Shamt 字段 为 全 0 HHA, B 6-19 给 出 了 每 种 可 变 移 位 指令 寄存 器 的 值 。 







汇编 代码 字段 值 机 器 代码 


op Trs rt rd shamt funct op rt rd shamt funct 
sllv $s3, $sl, $s2 0 | 18 


TS 
FT i9] © | | [Poeona [en [ono ooo] osozs1ssov 
sziv ssa, G01, sa| 0 [17 [20] ©] 6 | |eomolono[ || nm oro xsi ans 
srav $s5, $sl, $s2 fo {1s} i7}a|o| 7. 000000] 10010] 10001 | 10101 | 00000 [0001 1 1 (0x0251A807) 


6 位 5 位 5 位 5 位 5 位 6 位 6 位 5 位 5 位 5 位 5 位 6 位 
图 6-18 可 变 移 位 指令 的 机 器 代码 











源 寄存 器 
si [E11 Toom]oooo[oroo[ooo0lo01ol 1010]1000 
s<2 [p000 [000000000000 [ooo] 0000] 0000] 000 


汇编 代码 结果 


slv $63, ss1, $s2 $3 [0000] 0100] o000[ 0010] 01] 1000] 0000] 0000 
srlv $84, S61, $s2 _ Se [0000] 00001111 foor [ooo o100|0000| oo10 
srav $85, ss1, ss2 Ses [1111] 1117] 1111 Jo011 [ooo] o100{0000{ 0010 


图 6-19 ”可 变 移 位 操作 
3， 生 成 常数 
addi 指令 可 用 于 16 位 常数 赋值 ， 如 代码 示例 6. 10 所 示 。 


代码 示例 6. 10 16 位 常数 
高 级 语言 代码 MIPS 汇编 代码 


int a= 0x4f3c; #$sO0=a 
addi $s0, $0, Ox4f3c # a = Ox4f3c 


为 了 赋值 32 位 第 数 ， 可 以 先 使 用 一 条 装 和 人 高 位 立即 数 指令 (1ui ) ， 接 着 使 用 一 条 OR 立即 
数 指令 (ori) ， 如 代码 示例 6. 11 ARo lui 指令 将 一 个 16 位 立即 数 装 入 寄存 器 的 高 16 位 并 将 
低 16 位 都 设置 为 0。 如 前 所 述 ，ori 将 一 个 16 位 立即 数 合 并 到 寄存 器 的 低 16 位 。 


体系 结构 193 


代码 示例 6. 11 32 位 常数 
高 级 语言 代码 MIPS 汇编 代码 


int a = 0x6d5e4f3c; #$s0=a 


lui $s0, Ox6d5e # a = 0x6d5e0000 
ori $s0, $s0, Ox4f3¢ # a = Ox6d5e4f3c 


4. 乘法 和 除法 指令 ” 

乘法 和 除法 指令 与 其 他 算术 指令 有 些 不 同 。 两 个 32 位 数 相 乘 ， 产 生 一 个 64 位 乘积 。 两 个 
32 位 数 相 除 ， 产 生 一 个 32 位 的 商 和 一 个 32 位 的 余数 。 

MIPS 体系 结构 有 两 个 用 于 存放 乘法 和 除法 结果 的 特殊 用 途 寄 存 器 hi Allo. mult $s0, 
$sl 将 $s0 和 $sl 中 的 数 相 乘 。 结 果 的 高 32 位 存放 在 hi 中 , 低 32 位 存放 在 lo 中 。 类 似 
地 ，div $s0, $s1 计算 $s0/ $sl。 商 存放 在 1o 中 ,余数 存放 在 hi 中 。 

MIPS 提供 另 一 种 乘法 指令 ， 它 生成 存储 在 一 通用 寄存 器 中 的 32 位 结果 。mul $s1, 
$s2, $s3 把 $s2 和 $s3 中 的 值 相 乘 并 把 32 位 结果 存储 在 $sl 中 。 


6.4.2 分 支 


与 计算 器 相 比 ， 计 算 机 的 优势 在 于 它 能 做 出 判断 。 计 算 机 可 以 根据 输入 处 理 不 同 的 任务 。 
例如 ，if/else if”), switch/case 语句 、while 循环 和 for 循环 都 是 根据 某 个 测试 有 条 
件 地 执行 代码 。 

为 了 顺序 执行 指令 ， 程 序 计数 器 执行 一 条 指令 后 递增 4。 分 支 (branch) 指 令 改 变 程 序 计数 
名 的 值 ， 跳 过 某 段 代码 或 返回 到 执行 先前 的 代码 。 条 件 分 支 (condition branch ) 指令 执行 一 次 测 
试 ， 只 有 当 测 试 结果 为 TRUE 时 才 执 行 分 支 语 句 。 无 条 件 分 支 (unconditional branch ) 指令 称 为 
跳 转 (jump ) 指 令 ， 它 总 执行 分 支 语 句 。 

1. 条 件 分 支 

MIPS 指令 集 有 两 个 条 件 分 支 指令 ; beg 和 bne。 当 两 个 寄存 器 中 的 值 相 等 时 ，begG 执行 
分 支 语句 ; 当 两 个 值 不 相等 时 ，bne 执行 分 支 程 序 。 代 码 示例 6. 12 说 明 如 何 使 用 beq 指令 。 
注意 ， 分 支 写 成 beq Srs, Srt, imm, KE Srs 为 第 一 个 源 寄存 器 。 这 种 顺序 与 大 部 分 I 类 
型 指令 相反 。 


代码 示例 6. 12 ”使 用 beg 的 条 件 分 支 


MIPS 汇编 代码 
addi $s0, $0, 4 #$s0=0+4=4 
addi $sl, $0, 1 #$sl1=0+1=1 
sll $sl, $s1,2 #$sl=1<<2=4 
beq $s0, $sl, target #$s0==$s1, sobranchis taken 
addi $sl, $sl, 1 # not executed 
sub $sl, $s1, $s0 # not executed 


target: 
add $sl, $sl, $s0 #$sl=4+4=8 


当代 码 示例 6. 12 中 的 程序 执行 分 支 指令 beq 时 ，$s0 中 的 值 与 $s1 中 的 值 相 等 ， 所 以 执 
行 该 分 支 。 也 就 是 说 ， 下 一 条 要 执行 的 指令 是 标号 target 后 的 add 指令 。 在 分 支 指 令 后 和 标号 
前 的 两 条 指令 将 不 执行 。 

汇编 代码 使 用 标号 来 说 明 程 序 中 的 指令 位 置 。 当 汇编 代码 转换 为 机 器 代码 时 ， 这 些 


O ”实际 上 ， 由 于 流水 线 设 计 ( 第 7 章 中 讨论 ) MIPS 处 理 器 有 一 个 分 支 延 迟 槽 (branch delay slot) 。 这 意味 着 紧 
跟 在 分 支 或 者 跳 转 之 后 的 指令 总 是 被 执行 。 这 种 特质 在 本 章 的 MIPS 汇编 代码 中 忽略 。 
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标号 将 转换 为 指令 地 址 (参见 6.5 节 )。MIPS 汇编 语言 标号 后 面 跟着 一 个 冒号 “:”， 不 能 
使 用 指令 助 记 符 等 保留 字 。 大 多 数 程序 员 在 编程 时 为 了 突出 标号 ， 只 缩 进 代码 而 不 缩 进 
标号 o 

代码 示例 6. 13 给 出 了 使 用 条 件 分 支 指令 bne 的 例子 。 在 本 例 中 ， 因 为 $s0 与 $sl 相等 ， 
分 支 语 句 不 执行 ， 并 且 继 续 执行 bne 指令 后 面 的 语句 。 这 个 代码 段 的 全 部 指令 都 被 执行 。 


代码 示例 6. 13 (EA bne 的 条 件 分 支 


MIPS 汇编 代码 
addi $s0, $0, 4 # $s0=0+4=4 
addi $si, $0, I #$sl=0+1=1 
sire $s1, $si, 2 #$sl=1<<2=4 
bne $s0, $si, target # $s0 == $51, so branch is not taken 
addi $sl, $s1, 1 #$sl=4+1=5 
sub $sl, $s1, $50 #$sl=5-4=1 
target: 
add $51, $sl1, $s0 #$sl=1+4=5 
2. 跳 转 指令 


程序 可 以 使 用 三 种 跳 转 指令 完成 无 条 件 分 支 或 跳 转 (jump)。 这 三 种 指令 分 别 是 跳 转 指 
令 (j) 、 跳 转 和 链接 指令 (jal) 以 及 跳 转 寄存 器 指令 (jz) 。 跳 转 指令 (]j ) 直接 跳 转 到 标号 指 
定 的 指令 。 跳 转 和 链接 指令 (jal) 与 j 类 似 ， 但 它 保 存 返 回 地 址 。 这 点 将 在 6.4.6 节 中 讨 
论 。 跳 转 寄 存 器 指令 (jz ) 跳 转 到 寄存 器 所 保存 的 地 址 。 代 码 示 例 6.14 给 出 了 使 用 跳 转 指令 
(j) 的 例子 。 


代码 示例 6. 14 使 用 jj 无 条 件 跳 转 


MIPS 汇编 代码 
addi $s0, $0, 4 #$s0=4 
addi $sl, $0, 1 #$sl=1 
j target # jump to target 


addi $sl. $sl, 1 # not executed 
sub $sl, $51, $50 # not executed 


target: 
add $s1, $s1, $s0 #%$sl=1+4=5 


在 j target 指令 后 ， 代 码 示 例 6.14 中 的 程序 无 条 件 继续 执行 标号 target 处 的 指令 
add。 跳 转 指令 和 标号 之 间 的 所 有 指令 都 被 跳 过 了 。 

代码 示例 6. 15 给 出 了 使 用 跳 转 寄存 器 指令 ( jr) 的 例子 。 指 令 地 址 显示 在 每 条 指令 的 左 
Wo jr $s0 跳 转 到 sso 所 保存 的 地 址 ，0x00002010。 


代码 示例 6. 15 ”使 用 jz 无条件 跳 转 


MIPS 汇编 代码 

0x00002000 addi $s0, $0, Ox2010 #$s0= 0x2010 
0x00002004 jr $s0 # jump to 0x00002010 
0x00002008 addi $sl, $0, 1 # not executed 
0x0000200c sra $sl, $s1, 2 # not executed 


0x00002010 lw $s3, 44($s1) # executed after jr instruction 


6.4.3 ”条件 语句 
if, if/else 和 case 语句 是 高 级 程序 设计 语言 常用 的 条 件 语句 。 它 们 由 一 条 或 多 条 指 





| 
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令 组 成 ， 有 条 件 地 执行 一 块 (block ) 代码 。 本 节 将 介绍 如 何 把 这 些 高 级 语言 结构 转换 为 MIPS 汇 
编 语 言 。 

1. if 语句 

仅 当 满足 条 件 时 ，if 语句 执行 ff 块 (if block) 代 码 。 代 码 示例 6. 16 指出 了 如 何 将 if 语句 
转换 为 MIPS 汇编 代码 。 


代码 示例 6. 16 if 语句 
高 级 语言 代码 MIPS 汇编 代码 


if (i x= Jj) #$sO=f, $s1 =g, $s2=h, $53= j, $s4=j 
f=g+h: bne $s3, $54, L1 #1if i !=j, skip if block 
add $s0, $sl, $s2 #ifblock: f=g+h 
f=f=j: Ll: 


sub $s0, $s0, $53 #f=f-i 


站 语句 汇编 代码 的 检测 条 件 与 高 级 语言 代码 相反 。 如 代码 示例 6. 16 所 示 ， 高 级 语言 检测 
i == jj ,但 汇编 代码 检测 i ! = j。 当 i != jj 时 ，bne 指令 执行 分 支 ( 跳 过 计 块 )。 否 则 ， 当 
i == j 时 ,不 执行 分 支 ， 按 照 希望 的 方式 执行 ff 块 。 

2. if/else 语句 

if/else 语句 根据 条 件 执行 两 块 代码 中 的 一 块 。 当 满足 if 语句 中 的 条 件 时 ， 执 行 于 块 ， 
否则 ， 执 行 else 块 。 代 码 示例 6. 17 给 出 了 一 个 if/else 语句 的 例子 。 


代码 示例 6. 17 if/else 语句 


高 级 语言 代码 MIPS 汇编 代码 
if (i == j) #$s0 =f. $sl=g, $s2=h. $s3 =i, $84=j 
f=g+h; bne $s3, $s4, else #ifi!=j, branch toelse 
add $s0, $sl, $s2 # if block: f=g+h 
else ee 2 # skip past the else block 


f=f-i; else: 


sub $s0, $50, $53 # else block: f=f—i 
L2: 


Sit 语句 一 样 ，if/else 语句 汇编 代码 检测 的 条 件 与 高 级 语言 相反 。 例 如 ， 在 代码 示例 
6. 17 中 ， 高 级 语言 代码 检测 i == j。 汇 编 代 码 检 测 相 反 的 条 件 (i ! = j)。 如 果 那 个 相反 的 
条 件 为 真 ， 则 bne 跳 过 证 块 ， 执 行 else 块 。 和 否则， 执行 自 块 ， 并 用 一 个 跳 转 指令 (j ) 跳 过 
else 块 。 

3. switch/case 语句 ” 

switch/case 语句 根据 条 件 执行 多 块 代 码 中 的 一 块 。 如 果 不 能 满足 条 件 ， 则 执行 default 
块 。 一 条 case HWA 4FASAREWN if/else 语句 。 代 码 示例 6. 18 给 出 了 两 个 相同 功能 的 
代码 片断 。 代 码 计 算 自 动 柜 员 机 (ATM) 取 出 $20、$50 和 $100( 定 义 为 amount ) 的 费用 。 
MIPS 汇编 代码 的 实现 与 高 级 语言 代码 片断 相同 。 


6.4.4 ”循环 


循环 根据 某 个 条 件 重复 地 执行 一 块 代码 语句 。for 循环 和 while 循环 是 高 级 程序 语言 常 
用 的 循环 结构 。 本 节 将 介绍 如 何 把 它们 转换 为 MIPS 汇编 语言 。 

1. while 循环 

while 循环 重复 地 执行 一 块 代码 ， 直 至 某 个 条 件 不 再 满足 。 代 码 示例 6. 19 中 的 while tf 
环 求 出 满足 2” =128 的 x 值 。 它 循环 7 次， 直到 pow =128。 

5 if/else 语句 类 似 ，while 循环 的 汇编 代码 的 测试 条 件 与 高 级 语言 代码 相反 。 如 果 那 


个 相反 的 条 件 为 TRUE, ABA while 循环 就 停止 。 
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在 代码 示例 6. 19 F, while 循环 将 pow 值 与 128 进行 比较 ， 如 果 相 等 ， 就 退出 。 否 则 ， 
它 将 pow 值 乘 以 2( 左 移 1 位 )， 递增 x， 然后 跳 转 到 while 循环 的 开始 。 


代码 示例 6. 18 
高 级 语言 代码 


switch (amount) { 


case 20: fee=2; break; 


case 50: fee=3; break; 


case 100: fee =5; break; 


default: fee=0; 
} 


// equivalent function using if/else statements 
if (amount == 20) fee=2; 
else if (amount ==50) fee=3; 
else if (amount ==100) fee=5; 


else fee=0; 
代码 示例 6. 19 
高 级 语言 代码 
int pow=1; 
int x=0; 


while (pow != 128) 
{ 

pow = pow * 2; 

X aX + Ls 
} 


2. for 循环 


switch/case 语句 


MIPS 汇编 代码 
#$s0 = amount, $s1 = fee 


case20: 
addi $t0, $0, 20 
bne $s0, $t0, case50 


# $t0 = 20 

# amount == 20? if not, 
# skip to case50 

# if so, fee=2 

# and break out of case 


addi $sl, $0, 2 
j done 


case50: 
addi $t0O, $0, 50 
bne $s0, $t0, casel00 


# $t0 = 50 

# amount == 50? if not, 
# skip to casel00 

# if so, fee =3 

# and break out of case 


addi $sl, $0, 3 
j done 


casel00: 
addi $t0, $0, 100 
bne $s0, $t0, default 


# $tO = 100 
# amount == 100? if not, 
# skip to default 


addi $sl, $0, 5 # if so, fee=5 


j done # and break out of case 
default: 
add $sl, $0, $0 # fee=0 
done: 
while 循环 
MIPS 汇编 代码 
# $s0 = pow, $sl =x 
addi $s0, $0, 1 # pow= 1 
addi $s1, $0, 0 #x=0 
addi $t0, $0, 128 # t0 = 128 for comparison 
while: 
beq $s0, $t0, done # if pow==128, exit while loop 
sll $s0, $s0,1 # pow = pow * 2 
addi $sl, $sl, 1 #x=x+1 
j while 
done: 


与 while 循环 类 似 ，for 循环 重复 执行 一 段 代 码 ， 直 到 某 个 条 件 不 再 满足 。 但 是 ， 
for 循环 增加 了 对 循环 变量 (loop variable) 的 支持 ， 它 跟踪 循环 执行 的 次 数 。for 循环 的 基 


本 格式 为 : 


for (initialization; condition; loop operation) 


statement 


initialization( 初 始 化) 代码 在 for 循环 之 前 执行 。 每 次 循环 前 检查 condition( # 
件 ) 是 否 满 足 ， 如 果 不 满足 条 件 ， 则 退出 循环 。loop operation( 循 环 操作 ) 在 每 次 循环 后 


执行 。 


代码 示例 6. 20 将 数字 从 0 到 9 相 加 。 循 环 变量 i 初始 化 为 0。 然 后 在 每 次 循环 后 自 增 1。 
在 每 次 循环 前 ， 当 i 不 等 于 10 时，for MATT. AM, HAAR. KOE, for th 
环 执 行 10 Ko for 循环 可 以 用 while 循环 来 实现 ， 不 过 for 循环 通常 比较 方便 。 
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高 级 语言 编码 


int sum=0; 


构 


for (i=0; i !=10; i=i+1) [ 
sum = sSum+i ; 


代码 示例 6. 20 for 循环 


MIPS 汇编 编码 
外 $S0=1，$s1l1 = sum 


// equivalent to the following while loop 


int sum=0; 
inti=0O; 


while (i !=10) { 


sum = sum + i 
i=i+l; 


3. 量 值 比较 


目前 为 止 ， 例 子 使 用 beg 和 bne 指令 执行 相等 或 不 相等 的 比较 和 分 支 。MIPS 为 量 值 比较 


add 
addi 
addi 


for: 
beq 
add 
addi 
j 


done: 


$s1, 
$s0, 
$t0. 


$50, 
$sl, 
$50, 


for 
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$0, $0 # sum=0 
$0. 0 #i=0 
$0, 10 # $t0 = 10 
$t0, done #if i ==10, branch to done 
$51, $50 # sum = sum + í 
$s0, 1 # increment i 


提供 了 小 于 设置 指令 (slt)。 当 rs<rt 了 时，s1t 将 rd 设置 为 1， 否 则 ，rd 为 0。 
使 用 slt 指令 的 循环 
下 述 高 级 语言 代码 将 对 从 1 ~ 100 中 的 2 的 整数 次 寡 求 和 。 将 其 翻译 为 汇编 语言 程序 。 


// high-level code 


int sum=0; 
for (i =1:1<101; i=i * 2) 
sum = sum +i; 


解 : 汇编 语言 代码 使 用 小 于 设置 指令 (slt) 执 行 for 循环 中 的 小 于 比较 操作 。 


# MIPS assembly code 


#$s0=i, $sl1 = sum 


addi 
addi 
addi 
loop: 
slt 
beq 
add 
S13 
j 
done: 


$s1, $0, 0 
$s0, $0, 1 


# sum = 0 
#i=1 


$tO $0, 101 #$tO0=101 


Stl, $s0, $t0 
$t1, $0, done 
$S1, $sl1, $s0 
$s0, $s0, 1 
100p 


# if (i < 101) $tl=1, else $tl1=0 
# if $t1 == 0 (i >=101), branch to done 


# sum = sum + i 
#izi*2 


习题 6. 17 说 明 如 何 将 sit 用 于 大 于 、 大 于 或 等 于 、 小 于 或 等 于 等 其 他 量 值 比较 。 
6. 4.5 数组 


数组 用 于 访问 大 量 类 似 的 数据 。 数 组 按照 存储 器 中 顺序 
数据 地 址 组 织 。 每 一 个 数组 元 素 由 下 标 (index) 区 分 。 数 组 中 
元 素 的 个 数 称 为 数组 的 长 度 (size) 。 本 节 说 明 如 何 访问 存储 器 


中 数组 的 元 素 。 
1. 数组 下 标 
6-20 中 的 存储 器 中 有 一 个 包含 S 个 整数 的 数组 ， 下 标的 

范围 从 0 到 4。 这 种 情况 下 ， 数 组 存储 在 处 理 器 主 存 中 从 基地 





图 6-20 ”基地 址 为 0x10007000 的 
5 个 表 项 数组 


317 


t 


319 
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址 (base address )0x10007000 开始 的 连续 区 域 中 。 基 地 址 指定 了 第 一 个 元 素 array [0] 的 地 址 。 
代码 示例 6. 21 将 数组 array 中 的 前 两 个 元 素 乘 以 8 ， 然 后 再 将 它们 存储 到 该 数组 中 。 


代码 示例 6.21 数组 访问 


高 级 语言 编码 MIPS 汇编 编码 
int array[5]; # $s0 = base address of array 
lui $50, 0x1000 # $s0 = 0x10000000 
ori $s0, $50, Ox7000 # $s0 =0x10007000 
array[0] =array[0] * 8; Iw $tl, 0($s0) # $tl = array[0] 
SIT $tl, $tl, 3 #$tl=$tl<<3=$tl*8 
sw $tl, 0($s0) # array[0] =$tl 
array[1] =array[1] * 8; Iw $tl, 4($s0) # $t1 =array[1] 
Slit Stl. SEL; 3 #$tli=$tl << 3=$tl *8 
sw $tl, 4($s0) #array[1] = $tl 


访问 数组 元 素 的 第 一 步 是 将 数组 的 基地 址 装 人 寄存 器 。 代 码 示 例 6. 21 将 基地 址 读 入 $s0。 
可 以 使 用 lui 和 ori 指令 将 32 位 常数 装 人 寄存 器 。 

代码 示例 6. 21 还 说 明了 为 什么 1w 指令 需要 基地 址 和 偏 移 量 来 形成 有 效 地 址 。 基 址 指向 数 
组 的 起 始 位 置 ， 偏 移 量 用 于 访问 后 面 的 元 素 。 例 如 ，array [11 存 储 在 存储 器 地 址 0x10007004 
(在 array[0] 后 的 一 个 字 或 4 个 字 节 ) 中 ， 所 以 它 位 于 基 址 之 后 偶 移 量 为 4 的 位 置 。 

你 可 能 已 经 注意 到 ， 在 代码 示例 6. 21 中 ， 将 两 个 数组 元 素 相 乘 的 代码 ， 除 了 下 标 外 ， 其 
他 都 基本 相同 。 当 访问 两 个 数组 元 素 时 ， 复 制 一 段 代 码 不 是 问题 ， 不 过 在 访问 大 数组 的 所 有 元 
素 时 ， 这 十 分 不 方便 。 代 码 示例 6. 22 用 一 个 for 循环 将 基地 址 为 0x23B8F000 的 数组 中 的 所 有 
1000 个 元 素 乘 以 8。 


代码 示例 6. 22 使 用 for 循环 来 访问 数组 


高 级 语言 编码 MIPS 汇编 编码 
int i; # $s0 = array base address, $sl =i 
int array[1000]; # initialization code 
lui $s0, Ox23B8 # $s0 = Ox23B80000 
ori $s0, $s0, 0xF000 #$s0 = 0x23B8F000 
addi $s1. $0, 0 #1i=0 
addi $t2, $0, 1000 # $t2 = 1000 
for (i =0; 1¢1000; i=i+1) loop: 
slt $t0, $51, $t2 # i < 1000? 
beq $t0, $0, done # if not, then done 
sll $t0, $51, 2 # $t0 = i*4 (byte offset) 
add $t0, $t0, $s0 # address of array[i] 
array[i] =array[i] * 8; iw $t1, 0($t0) # $tl = array[i] 
sll Stl: $t1, 3 # $t1l =arrayli] *8 
sw $tl, 0($t0) # array[i] =array[i] * 8 
addi $si, $s1, 1 #1 三 1i 寺 1 
j loop # repeat 
done 


6-21 显示 了 存储 器 中 有 1000 个 元 素 的 一 个 数组 。 
数组 下 标 为 变量 i 而 不 是 常数 ， 所 以 不 能 使 用 lw 中 的 立 | 
即 数 偏 移 量 。 相 反 ， 可 以 计算 第 i 个 元 素 的 地 址 ， 并 将 。 | 38 
它 存储 在 St0 中 。 需 要 注意 的 是 ， 每 一 个 数组 元 素 为 一 ° ng Pr 
个 字 ， 但 存储 器 是 字 节 寻 址 的 。 所 以 从 基地 址 开始 ， 偏 


ne a 23B8F004 | array[l] | 
移 量 为 i x4。 在 MIPS 汇编 语言 中 ， 可 以 用 左 移 两 位 实 dd e e 


现 乘 以 4 的 操作 。 这 个 例子 可 以 很 容易 地 扩展 应 用 到 任 
意 长 度 的 数组 。 主 存 


2. 字 节 和 字符 图 6-21 内存 中 基地 址 为 0x23B8F000 
范围 在 [ -128, 127] 的 数 可 以 存储 在 一 个 单独 字 节 的 array [1000] 
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中 ， 而 不 需要 一 个 完整 字 。 因 为 英语 键盘 上 的 按键 数 远 远 少 于 256， 所 以 英语 字符 经 常用 字 节 
表示 。C 语言 使 用 char 类 型 来 表示 字 节 或 字符 。 

早期 的 计算 机 缺乏 字 节 与 英语 字符 之 间 的 标准 上 映射， 所 以 计算 机 之 间 交 换文 本 很 困难 。 
1963 年 ， 美 国标 准 委 员 会 发 表 了 用 于 信息 交换 的 美国 标准 代码 (ASCI) 。 它 为 每 个 文本 字符 确 
定 了 一 个 唯一 的 字 节 值 。 表 6-2 给 出 了 可 印刷 字符 的 编码 。ASCII 值 采 用 十 六 进 制 编 码 。 大 写 
字母 与 小 写字 母 之 间 相 差 0x20(32 ) 。 


表 6-2 ASCII 编码 表 

















> — 


20 空格 0 @ 50 P 70 p 
21 ! 1 A 51 Q a 71 q 
22 2 B 52 R b 72 r 
23 # 3 C 53 S c 73 S 
24 $ 4 D 54 | T d 74 t 
25 % 5 E 55 U = 75 u 
26 & 6 F 56 V £ 76 v 
27 ' 7 G 57 W g 77 wW 
28 ( 8 H 58 x h 78 x 
29 ) 9 I 59 Y i 79 y 
2A * : 可 Z j 7A z 
2B + K [ k 7B { 
2C L \ 1 

M m 

N n 

O O 


MIPS 提供 装 人 字 节 和 存储 字 节 指令 来 操作 字 节 或 字符 类 型 的 数据 : 装 入 无 符号 字 市 


(1bu) ， 装 入 字 节 (1b) 和 存储 字 节 ( sb) 。 图 6-22 描述 了 这 三 种 指令 。 

装 和 人 无 符号 字 节 指令 ( 1bu) 和 装 人 字 节 指令 (1b) 分 rer 
别 对 字 节 进行 0 扩展 和 符号 扩展 来 填充 32 位 寄存 器 。 存 字 ? 地 址 |3 2 1 0 
储 字 节 指令 ( sb) 将 32 位 寄存 器 中 的 最 低 有 效 字 节 存 储 天 
到 存储 器 中 的 指定 字 节 地 址 。 在 图 6-22 中 ，1bu 指令 将 寄存 器 
存储 器 地 址 2 中 的 字 节 装 人 $s1 的 最 低 有 效 字 节 , 并 用 $s1 [00] 00] 00/8C] 1bu $s1,2($0) 
0 填充 剩 下 的 寄存 器 。1lb 指令 将 存储 器 地 址 2 中 的 符号 $s2 1b$ s2, 2($0) 
扩展 字 节 装 人 $s2 P. sb 指令 将 $s3 的 最 低 有 效 字 他 ss3 XXX9B| sbs <3, 
存储 到 存储 器 地 址 3 中 ， 它 用 0x9B 取代 0XF7。 $s3 的 rey 
最 高 有 效 字 节 部 分 被 忽略 。 图 6-22 装 入 和 存储 字 节 指令 


使 用 1b 和 sb 访问 字符 数组 

下 面 的 高 级 语言 代码 将 大 小 为 10 的 数组 中 所 有 小 写字 母 减 去 32， 将 其 转化 为 大 写字 母 。 
将 此 高 级 语言 代码 转换 为 MIPS 汇编 语言 。 注 意 ， 数 组 元 素 之 间 的 地 址 变化 是 1 个 字 节 而 不 是 4 
个 字 节 。 假定 $s0 已 经 保存 了 chararray 的 基地 址 。 


// high-level code 


char chararray[10]; 

int i; 

for (i =0; 7 !=10; i=i7+4+1) 
chararray([i] = chararray[i] - 32; 


323 
l 
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解 : 


# MIPS assembly code 
# $s0 = base address of chararray, $sl =i 


addi $s1, $0, 0 #i=0 
addi $t0, $0, 10 # $t0 = 10 
loop: beq $t0, $s1, done #if i==10, exit loop 
add $tl, $s1, $s0 #$%tl=address of chararray[i] 
lb $t2, 0($t1) # $t2 = array[i] 
addi $t2, $t2, -32 #convert to upper case: $t2 = $t2 — 32 
sb = $t2, 0($t1) # store new value in array: 


# chararray[i] = $t2 
addi $sl, $sl, 1 # i = i+1 


j 100 # repeat 
done: : P P < 


一 个 字符 序列 称 为 字符 串 (string)。 字 符 串 的 长 度 可 变 ， 因 此” 字 地 址 ， 数据 
程序 设计 语言 必须 提供 一 种 方法 来 确定 字符 串 的 长 度 或 确定 字符 | i 


串 的 结尾 。 在 C 语言 中 ， 空 字符 (0x00) 意味 着 字符 串 的 结束 。 例 1522FFF4 [ola] 
如 ， 图 6-23 H T F “Hello!” (0x48 65 6C 6C 6F 21 00) 在 ”1522FFF0 


存储 妖 中 的 存储 方式 。 这 个 字符 串 有 7 个 字 节 ,地 址 从 


0x1522FFF0 到 0x1522FFF6， 字 符 串 的 第 一 个 字符 (H = 0x48 ) 存储 | 
在 最 低 字 节 地 址 (0x1522FFF0)。 小 端 存储 器 

图 6-23 存储 器 中 存储 的 
6.4.6 函数 调用 AGH “Hello!” 


高 级 程序 语言 经 常 使 用 函数 (function) ， 也 称 为 过 程 (procedure) ， 重 用 经 常 使 用 的 代码 ， 
并 使 程序 更 加 模块 化 和 可 读 。 也 数 的 输入 和 输出 分 别称 为 参数 (arguments) 和 返回 值 (return 
value) 。 函 数 将 计算 返回 值 并 且 不 会 产生 其 他 非 预 期 的 不 良 影响 。 

当 一 个 函数 调用 其 他 函数 时 ， 调 用 函数 (caller) 和 被 调用 函数 (callee) 必须 要 在 参数 和 返回 
值 上 保持 一 致 。MIPS 系统 的 惯例 是 : 调用 函数 在 调用 前 要 将 4 个 参数 分 别 放 在 $a0 ~ $a3 tF, 
被 调用 函数 在 完成 前 将 返回 值 放 在 $v0 ~ $v1 中 。 遵 循 这 种 惯例 ， 即 使 由 不 同人 写 的 调用 区 
数 和 被 调用 肾 数 也 知道 参数 和 返回 值 在 何 处 。 

被 调用 也 数 不 能 影响 调用 也 数 的 功能 。 简 单 地 说 ， 这 意味 着 被 调用 阴 数 必须 知道 当 它 完 
后 要 返回 到 哪里 ， 而 且 它 不 能 破坏 调用 畏 数 用 到 的 寄存 器 和 内 存 。 调 用 晴 数 将 返回 地 址 (return 
address) 存储 在 Sra 寄存 器 中 ， 与 此 同时 ， 它 使 用 jal 指令 跳 转 到 被 调用 晒 数 入 口 。 被 调用 郑 
数 不 能 覆盖 调用 函数 所 需要 的 任何 体系 结构 状态 和 内 存 。 有 具体 地 说 ， 被 调用 函数 必须 保证 存储 
寄存 项 $s0 ~ $s7 和 Sra 以 及 用 于 存放 临时 变量 的 栈 (stack ) 不 被 修改 。 

本 节 将 介绍 如 何 调用 一 个 函数 并 从 此 被 调用 函数 中 返回 ， 同 时 还 将 介绍 如 何 访问 输入 参数 
和 返回 值 ， 如 何 使 用 栈 来 存储 临时 变量 。 

1. 函数 调用 和 返回 

MIPS 使 用 jal 指令 调用 一 个 图 数 ， 使 用 jz 指令 从 函数 返回 。 代 码 示例 6. 23 描述 了 main 
因数 如 何 调 用 simple 函数 ， 其 中 main 是 调用 函数 ，simple 是 被 调用 函数 。 调 用 simple 
因数 时 没有 输入 参数 ， 也 不 产生 返回 值 ， 它 仅仅 是 返回 到 调用 图 数 。 在 代码 示例 6.23 H, H 
令 地 址 在 每 一 条 MIPS 指令 的 左边 以 16 进 制 给 出 。 

jal 指令 和 jr 指令 是 函数 调用 中 两 个 很 重要 的 指令 。jal 指令 完成 两 种 功能 : 1) 将 下 一 
条 指令 (jal 后 面 的 指令 ) 的 地 址 存储 到 返回 地 址 寄存 器 Sra 中 ; 2) 跳 转 到 目标 指令 。 

在 代码 示例 6. 23 F, main 因数 通过 执行 jal 指令 调用 simple MA. jal 跳 转 到 sim- 
ple 标号 ， 同 时 将 0x00400204 存储 到 Sra 寄存 器 中 。simple 通过 执行 jr $ra( 跳 转 到 $ra 
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寄存 器 保存 的 指令 地 址 ) 立即 返回 。 main PKI a Hb Hit 0x00400204 处 继续 执行 。 
代码 示例 6. 23 simple 程序 调用 


高 级 语言 代码 MIPS 汇编 代码 

int main() | 0x00400200 main: jal simple # call function 
simple(); 0x00400204 io 

} 

// void means the function returns no value 

void simple() | 0x00401020 simple: jr $ra # return 


return; 
| 


2. 输入 参数 和 返回 值 

代码 示例 6. 23 中 的 simple 函数 没有 什么 用 处 ， 因 为 它 既 没有 从 调用 函数 main 中 获得 输 
A, 也 没有 返回 输出 。 根 据 MIPS 惯例 ， 程 序 使 用 $a0 ~ $a3 保存 输入 参数 ， 使 用 $v0 ~ $v1 保 
存 返回 值 。 在 代码 示例 6. 24 中 ， 用 4 个 参数 调用 困 数 diffofsums ， 并 返回 一 个 返回 值 。 


代码 示例 6. 24 拥有 参数 和 返回 值 的 函数 调用 


高 级 语言 代码 MIPS 汇编 代码 
int main() #$sO=y 
| main: 

int y; 


addi $a0, $0, 2 # argument 0 = 2 
addi $a1, $0,3 # argument 1 =3 
addi $a2, $0, 4 # argument 2 = 4 
addi $a3, $0, 5 # argument 3=5 
jal diffofsums # call function 
add $s0, $v0, $0 #y=returned value 


y =diffofsums(2, 3, 4, 5); 


int diffofsums(int f, intg, inth, int i) 
{ 
int result; 


#$s0 = result 

diffofsums: 
add $t0, $a0, $al #$tO=f+g 
add $tl, $a2, $a3 # $tl=h+i 
sub $s0, $t0, $tl # result =(f+g9) —(h+i) 
add $v0, $s0, $0 # put return value in $v0 
jr tra # return to caller 


result=(f+g)—(h+i); 
return result; 


根据 MIPS 惯例 ， 调 用 程序 (main ) 将 程序 参数 从 左 到 右 放 入 输入 寄存 器 $a0 ~ $a3 o 
被 调用 程序 (diffofsums ) 将 返回 值 存储 到 返回 寄存 器 $v0 Po 

返回 64 位 值 ( 例 如 一 个 双 精 度 浮 点 数 ) 的 天 数 将 使 用 两 个 返回 寄存 器 Svo 和 $vl。 当 调用 
多 于 4 个 参数 的 函数 时 ， 多 出 来 的 输入 参数 将 放 人 栈 中 ， 这 个 问题 我 们 下 面 讨 论 。 

3. 栈 

#% ( stack ) 是 用 于 存储 函数 中 局 部 变量 的 存储 器 。 当 处 理 器 需要 更 多 空间 时 ， 栈 会 扩展 (使 
用 更 多 的 内 存 ) ; 当 处 理 器 不 再 需要 存在 栈 中 的 变量 时 ， 栈 会 缩小 (使 用 较 少 的 内 存 ) 。 在 解释 
函数 如 何 使 用 栈 存储 临时 变量 前 ， 我 们 首先 解释 栈 是 怎样 工作 的 。 

栈 是 一 个 后 进 先 出 (Last-In-First-Out，LIFO) 队 列 。 类 似 于 一 堆 盘 子 ， 最 后 入 乒 的 元 素 ( 最 
上 面 的 盘子 ) 首 先 出 栈 。 每 一 个 函数 需要 分 配 栈 空间 来 存储 局 部 变量 ， 并 在 函数 返回 前 回收 空 
间 。 栈 顶 (the top of stack) 是 最 后 分 配 的 空间 。 而 一 堆 盘 子 的 空间 是 向 上 增长 的 ，MIPS 栈 在 内 
存 中 是 向 下 增长 的 。 当 一 个 程序 需要 更 多 的 空间 时 ， 栈 空间 向 内 存 中 地 址 较 低 的 方向 扩展 。 

图 6-24 给 出 了 栈 的 图 示 。 栈 指针 ( stack pointer) $sp 是 一 个 特定 的 MIPS 寄存 器 ， 此 寄存 
器 指向 栈 顶 。 指 针 (pointer) 是 内 存 地 址 的 一 个 新 名 字 。 指 针 指 向 数据 ， 给 出 此 数据 的 地 址 。 例 
如 ， 图 6-24a 中 的 栈 指针 Ssp 保存 了 地 址 值 0x7FFFFFFC， 它 指向 数据 值 0x12345678。 $sp 指 
向 栈 顶 ( 栈 的 最 低 可 访问 内 存 ) 。 因 此 ， 在 图 6-24a 中 ， 栈 不 能 访问 比 0x7FFFFFFC 更 低 的 内 存 。 


202 第 6 章 


地 址 数据 地 址 数据 










TFFFFFFC| 12345678 $sp TFFFFFFC| 12345678 
7FFFFFF8| | 7FFFFFF8 | AABBCCDD 
TEFFFFF4{ | TFFFFFF4 | 11223344 $sp 
TPFFFFFO[ | TEEFFFFO[ | 
a) b) 
图 6-24 栈 


栈 指针 ( $sp) 开 始 于 一 个 高 内 存 地 址 ， 通 过 地 址 的 递减 来 扩展 栈 空间 。 图 6-24b 显示 了 栈 
扩展 充 许 临时 存储 多 于 两 个 数据 字 。 为 此 ，$sp 减 8 变 成 0x7FFFFFF4。 两 个 新 的 数据 字 
(OxAABBCCDD Ail 0x11223344 ) 临 时 存储 在 栈 中 。 

栈 的 一 个 重要 应 用 是 保存 和 恢复 天 数 使 用 的 寄存 器 。 函 数 应 该 计算 返回 值 ， 但 不 应 该 产生 
其 他 负面 影响 。 尤 其 是 ， 除 了 包含 返回 值 的 寄存 器 $v0( 和 $vl1， 如 果 结 果 为 64 位 数 ) 外 ， 其 
他 任何 寄存 器 都 不 应 该 被 修改 。 代 码 示 例 6. 24 中 的 diffofsums 程序 违反 了 这 个 规则 ， 因 为 
它 修改 了 St0、Stl 和 $s0。 如 果 main 在 调用 diffofsums 之 前 使 用 St0、 $t1 或 者 $s0 ， 
那么 这 些 寄存 器 的 内 容 会 被 调用 函数 破坏 。 

为 了 解决 这 个 问题 ， 在 函数 修改 寄存 器 前 ， 它 要 将 寄存 器 保存 在 栈 中 ， 然 后 在 返回 前 从 栈 
中 恢复 这 些 寄 存 器 。 具 体 来 说 ， 项 数 将 按照 以 下 步骤 执行 : 

1) 创建 栈 空间 来 存储 一 个 或 多 个 寄存 器 的 值 。 

2) 将 寄存 器 的 值 存储 在 栈 中 。 

3) 使 用 寄存 器 执行 图 数 。 

4) 从 栈 中 恢复 寄存 器 的 原始 值 。 

5) 回收 栈 空 间 。 

代码 示例 6. 25 给 出 了 diffofsums 的 改进 版 ， 它 存储 和 恢复 St0、Stl 和 $s0。 图 6-25 
描述 了 调用 diffofsums 之 前 、 之 中 和 之 后 栈 的 情况 。 diffofsums 通过 将 栈 指 针 减 12 得 到 
3 个 字 的 存储 空间 ， 然 后 在 新 分 配 的 空间 中 存储 Sto, $t1 和 $s0 的 当前 值 。 接 着 将 执行 后 
续 函 数 ， 并 可 以 改变 这 3 个 寄存 器 的 值 。 在 函数 的 末尾 ，diffofsums 从 栈 中 恢复 sto. Stl 
和 $s0 的 值 ， 回 收 栈 空间 ， 并 返回 。 当 函数 返回 时 ， 用 $v0 保存 结果 ， 但 其 他 寄存 器 不 受 影 
Me, S$tO, $t1, $s0 和 $sp 中 的 数值 与 函数 调用 之 前 的 值 相同 。 


代码 示例 6. 25 ”函数 在 栈 中 保存 寄存 器 


MIPS 汇编 代码 

# $s0 = result 

diffof sums: 
addi $sp, $sp, -12 # make space on stack to store three registers 
sw $50, 8($sp) # save $s0 on stack 
sw $t0,4($sp) # save $t0 on stack 
sw $tl, O($sp) # save $ti on stack 
add $t0, $a0, $al # S$tO=f+g 
add $tl, $a2, $a3 # $tl=h+i 
sub $s0, $t0, $tl # result=(f+g) —(h+i) 
add $v0, $s0, $0 # put return value in $v0 
Iw $t1,0($sp) # restore $tl from stack 
Iw $t0, 4($sp) # restore $t0 from stack 
lw $50, 8($sp) # restore $s0 from stack 
addi $sp, $sp. 12 # deallocate stack space 
jr $ra # return to caller 


体系 结构 203 





a) 调用 diffofsums 之 前 b) 调用 diffofsums 之 中 c) 调用 diffofsums 之 后 
图 6-25 在 调用 diffofsums 之 前 、 之 中 和 之 后 栈 的 情况 


背 数 为 自己 分 配 的 栈 空间 称 为 栈 帧 ( stack frame)。diffofsums 栈 框架 的 深度 为 3 个 
字 。 模 块 化 的 原则 告诉 我 们 ， 每 个 函数 应 该 只 访问 自己 的 栈 框架 而 不 应 该 访问 其 他 函数 的 
栈 框架 。 

4. 受 保 护 寄 存 器 

代码 示例 6. 25 假定 临时 寄存 器 Sto 和 Stl 必须 被 保存 和 恢复 。 如 果 调 用 函数 不 用 这 些 寄 
存 器 ， 对 它们 的 保存 和 恢复 就 是 无 用 的 操作 。 为 了 避免 这 种 无 用 的 操作 ，MIPS 将 寄存 器 划分 
Al & RAP ( preserved ) 类 型 和 不 受 保 护 (nonpreserved ) 类型。 受 保 护 寄存 器 包括 $s0 ~ $s7( 因 
此 ， 它 们 的 名 字 就 是 保存 寄存 器 ) ， 不 受 保护 寄存 器 包括 Sto ~ $t9( 因此， 它们 的 名 字 就 是 
临时 寄存 器 ) 。 函 数 必须 保存 和 恢复 任何 需要 使 用 的 受 保护 寄存 器 ,但 是 可 以 随意 改变 不 受 保 
护 寄存 器 。 

代码 示例 6. 26 描述 了 对 diffofsums 的 进一步 修改 ， 只 将 $s0 RAER, $to 和 Stl 
是 不 受 保护 寄存 器 ， 所 以 它们 不 需要 保存 在 栈 中 。 


代码 示例 6. 26 ”将 受 保护 寄存 器 保存 在 栈 中 的 函数 
MIPS 汇编 代码 


# $s0 =result 

diffofsums 
addi $sp, $sp, 一 4 # make space on stack to store one register 
sw $s0, O( $sp) # save $s0 on stack 
add $t0, $a0, $al # $tO0=f+g 
add $tl, $a2, $a3 # $ti=h+i 
sub $s0, $t0, $ti # result=(f+g9) -—(h+i) 
add $v0, $s0, $0 # put return value in $v0 
lw $50, O($sp) # restore $s0 from stack 
addi $sp, $sp. 4 # deallocate stack space 
jr $ra # return to caller 


WE, -TARAA RR, AAR AA ak, RAR ee, BIA AA 
PR FN Zi GRAF AK IZ ESE FD BE SR AF EAE BF RARA BY BE A EB] AN SSR FE 
因此 如 果 调 用 函数 需要 其 不 受 保护 寄存 器 中 的 有 效 数 据 不 被 改变 ， 那 么 它 在 函数 调用 之 前 需要 
保存 不 受 保护 寄存 器 ， 而 且 还 需要 在 调用 之 后 恢复 这 些 寄 存 器 。 这 种 情况 下 ， 受 保护 寄存 器 也 
可 以 称 为 被 调用 者 保存 (callee- save) 寄存 器 ， 不 受 保 护 寄 存 器 称 为 调用 者 保存 (caller-save) 寄 
存 器 。 

表 6-3 总 结 了 哪些 寄存 器 是 受 保护 寄存 器 ，$s0 ~ $s7 常用 于 保存 函数 中 的 局 部 变量 ， 所 
以 它们 必须 被 保存 。 Sra 也 要 被 保存 ， 这 样 函 数 才 能 知道 返回 到 哪里 。 St0 ~ Sto 用 于 在 向 
局 部 变量 赋值 前 保存 临时 结果 ， 这 些 计算 结果 一 般 在 函数 调用 之 前 完成 ， 所 以 它们 不 受 保护 ， 
调用 函数 一 般 不 需要 保存 它们 。 $a0 ~ SA 经 常 在 调用 函数 的 过 程 中 被 覆盖 ， 因 此 ， 如 果 被 
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调用 的 函数 返回 后 ， 调 用 晒 数 根据 它 目 身 参 数 执行 ， 则 $a0 ~ $a3 必须 由 调用 函数 保存 。 
$v0 ~ $v1 不 用 被 保护 ， 因 为 被 调用 函数 将 返回 结果 放 人 这 些 寄 存 融 中 。 


表 6-3 受 保护 和 不 受 包 含 寄存 器 


受 保护 寄存 器 不 受 保护 寄存 器 受 保护 寄存 器 不 受 保护 寄存 器 
保存 寄存 器 : $s0 - $s7 临时 寄存 器 : St0 - $t9 栈 指针 : $sp 返回 值 寄存 器 : $v0 - Svl 
返回 地 址 : Sra 参数 寄存 器 : $a0 - $a3 栈 指针 以 上 的 空间 栈 指针 以 下 的 空间 


栈 指针 以 上 的 栈 空间 目 动 保护 ， 只 要 被 调用 函数 不 回 $sp 之 上 的 内 存 地 址 写 数 据 。 这 样 
不 会 修改 其 他 困 数 栈 帧 。 栈 指针 自身 是 受 保 护 的 ， 这 是 因为 被 调用 函数 在 返回 前 需要 回收 自己 
的 栈 空间 ， 栈 空间 的 大 小 为 函数 结束 时 的 地 址 减 去 函数 开始 时 $sp 保存 的 值 。 

5. 递归 函数 调用 

不 用 调用 其 他 郴 数 的 图 数 称 为 叶子 (leaf) KZ, W diffofsums 函数 。 调 用 其 他 函数 的 函 
数 叫 作 非 叶子 (nonleaf) 盟 数 。 如 同 前 所 述 ， 非 叶子 函数 一 般 更 复杂 ， 因 为 在 调用 其 他 函数 前 ， 
它们 需要 把 不 受 保护 寄存 器 保存 到 栈 中 ， 然 后 在 调用 后 再 恢复 这 些 寄 存 器 。 具 体 来 说 ， 调 用 郴 
数 保 存 它们 所 需要 的 任何 不 受 保护 寄存 器 ( St0 ~ St9 和 $a0 ~ $a3) ， 被 调用 函数 保存 需要 
修改 的 任意 受 保护 寄存 器 ( $s0 ~ $s7 和 Sra). 

递归 (recursive) 函数 是 调用 自己 的 一 个 非 叶 子 函 数 。 阶 乘 函 数 可 以 使 用 递归 函数 来 描述 。 
阶乘 函数 为 factorial(n) =nx(n-1)x(n-2)x:…x2xl1。factorial MAMA Wis lw Sx 
factorial(n) =n xfactorial(n -1), 1 的 阶乘 还 是 1。 代码 示例 6. 27 描述 了 阶乘 函数 的 递归 写法 。 
为 了 方便 地 标明 函数 地 址 ， 假 定 函 数 的 起 始 地 址 为 0x90。 


代码 示例 6. 27 factorial 递归 函数 调用 


高 级 语言 代码 汇编 语言 代码 
int factorial(int n) { 0x90 factorial: addi $sp, $sp, -8  # make room on stack 
0x94 sw $a0. 4($sp) # store $a0 
0x98 sw $ra, O($sp) # store $ra 
0x9C addi $t0, $0, 2 # $tO0=2 
if (n<=1) OxAO slt $t0, $a0, $t0 #n<=17? 
return 1; OxA4 beq $t0, $0, else #no: gotoelse 
0xA8 addi $v0, $0, 1 # yes: return 1 
OxAC addi $sp, $sp, 8 # restore $sp 
0xB0 jr $ra # return 
else 0xB4 else: addi $a0, $a0, -1 #n=n-1 
return (n * factorial(n—1)); 0xB8 jal factorial # recursive call 
} OxBC Iw $ra, O($sp) # restore $ra 
0xC0 Iw $a0, 4($sp) # restore $a0 
0xC4 addi $sp, $sp, 8 # restore $sp 
0xC8 mul $v0, $a0, $v0 #n* factorial(n—1) 
0xCC jr $ra # return 


factorial 函数 可 能 修改 Sad 和 $rza， 所 以 它 将 这 两 个 寄存 器 保存 在 栈 中 。 然 后 它 检查 
n 是 否 小 于 2， 如 果 m 小 于 2， 就 返回 1 并 保存 在 Svo 中 ， 恢 复 栈 指针 ， 返 回 到 调用 函数 。 这 
种 情况 下 ， 不 需要 重新 装 人 人 $ra 和 $a0 ， 因 为 它们 没有 被 修改 。 如 果 n 大 于 1， 函数 将 递归 调 
用 factorial(n -1)， 然 后 它 从 栈 中 恢复 n( $a0 ) 的 值 和 返回 地 址 ( $za) ， 执 行 乘法 ， 返 回 
结果 。 乘 法 指令 (mul $v0, $a0, $v0)# $a0 和 $v0 WR, KARFA $v0 中 。 

图 6-26 显示 了 执行 factorial(3) 时 栈 的 情况 。 假 定 $sp 最 初 指 向 0xFC， 如 图 6-26a 所 
示 。 函 数 创 建 两 个 字 的 栈 空间 来 保存 $a0 和 Sra. 在 第 一 次 调用 时 ，factorial 将 $a0 
( $a0 中 保存 着 n =3) 保 存在 0xF8 F, 将 Sra 保存 在 0xF4 中 ， 如 图 6-26b 所 示 。 然 后 函数 将 
$a0 中 的 内 容 改变 为 n =2 并 递归 调用 factotial(2), 使 Sra 保存 0xBC。 在 第 二 次 调用 时 ， 
fuctorial 将 $a0( $a0 中 保存 着 n =2) 保 存在 0xF0 中 ,将 Sra 保存 在 0xEC 中 。 这 时 ， 我 
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们 知道 $ra 中 存储 了 0xBC。 然 后 函数 将 $a0 中 的 内 容 改 变 为 n =1 并 递归 调用 factorial 
(1)。 在 第 三 次 调用 时 ，fuctorial 将 $a0( $a0 中 保存 这 nm =1) 保 存在 0xE8 中 ,将 $ra 保 
存在 0xE4 中 。 这 时 ，$ra 存储 的 还 是 0xBC。fuctorial 的 第 三 次 调用 返回 保存 在 $v0 中 的 
1， 并 且 在 返回 到 第 二 次 调用 前 回收 栈 空间 。 第 二 次 调用 将 n 恢复 为 2， 将 Sra 恢复 为 0xBC 
(Sra 中 已 经 是 这 个 值 了 ) ， 然 后 回收 栈 帧 ， 返 回 $v0 =2 xl =2 给 第 一 次 调用 。 第 一 次 调用 将 
n 恢复 为 3， 将 Sra 恢复 为 调用 函数 的 返回 地 址 ， 回 收 栈 帧 ， 返 回 $v0 =3 x2 =6。 图 6-26c © 
示 了 递归 调用 也 数 返回 时 栈 的 情况 。 当 factorial 返回 到 调用 函数 时 ， 栈 指针 指向 它 的 初始 
位 置 (0xFC)， 指 针 之 上 的 栈 空间 的 内 容 没 有 变化 ， 而 且 所 有 受 保护 寄存 器 保存 它们 的 初始 值 ， 
$v0 保存 返回 值 6。 


地 址 数据 地 址 ”数据 地 址 ”数据 








FC $sp FC 
F8 F8 


$sp $v0=6 








me 


$a0 =3 


F4 F4|$ra |<— Sp F4 oe arg 
FO FO FO 

EC EC Ssp EC | Sra( peepee 
E8 E8 E8 | $a0 (0x1) 

E4 E4 | $ra (0xBC) $sp E4 | $ra ( Ssp wy E 


| 
| 
| 
| 
a 


| | 
) 调用 前 b ) 最 后 一 次 递归 调用 后 c) 返回 后 
图 6-26 在 factorial M% (n =3) 期 间 栈 的 变化 


6. 附加 参数 和 局 部 变量 

函数 可 能 有 多 于 4 个 的 参数 和 局 部 变量 。 使 用 栈 存 储 这 些 临时 数据 。 依 照 MIPS 惯例 ， 如 
果 一 个 函数 有 4 个 以 上 的 参数 ， 则 前 4 个 参数 像 往 常 一 样 存储 在 参数 寄存 器 中 ， 额 外 的 参数 使 
用 栈 指针 之 上 的 空间 保存 在 栈 中 。 调 用 函数 (caller) 必须 扩展 栈 空 间 来 满足 额外 的 参数 ， 图 6-27a 


a) 调用 前 
图 6-27 栈 的 使 用 


了 本数 也 可 以 声明 局 部 变量 或 数组 ， 局 部 变量 在 一 个 函数 内 部 定义 并 且 只 能 在 该 函数 内 部 使 
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用 。 局 部 变量 存储 在 $s0 ~ $s7 中 。 如 果 有 许多 局 部 变量 ， 它 们 也 可 以 存储 在 这 个 函数 的 栈 
空间 中 。 尤 其 是 ， 局 部 数组 存储 在 栈 中 。 

图 6-27b 给 出 了 被 调用 函数 的 栈 框架 帧 。 栈 框架 保存 函数 自己 的 参数 、 返 回 地 址 、 函 数 要 
修改 的 保存 寄存 器 。 它 还 存储 局 部 数组 和 额外 的 局 部 变量 。 如 果 被 调用 函数 有 4 个 以 上 的 参 
数 ， 它 可 以 从 调用 函数 的 栈 帧 中 找到 它们 。 访 问 额外 的 输入 参数 是 一 种 特殊 情况 ， 在 这 种 情况 
下 函数 可 以 访问 不 属于 自己 栈 帧 中 的 数据 。 


6.5 寻 址 方式 


MIPS 使 用 5 种 寻 址 方式 (addressing mode); 寄存 峰 寻 址 、 立 即 数 寻 址 、 基 地 址 寻 址 、PC 
相对 寻 址 和 伪 直 接 寻 址 。 前 3 种 寻 址 方式 (寄存 器 寻 址 、 立 即 数 寻 址 和 基地 址 寻 址 ) 定 义 读 / 写 
操作 数 的 模式 ， 后 两 种 寻 址 方式 (PC 相对 寻 址 和 伪 直 接 寻 址 ) 和 定义 写 程序 计数 器 PC 的 方式 。 

1. 寄存 器 寻 址 

寄存 器 寻 址 (register-only addressing) 使 用 寄存 器 存储 所 有 源 操作 数 和 目的 操作 数 。 所 有 的 
R 类 型 指令 都 使 用 寄存 器 寻 址 。 

2. 立即 数 寻 址 

立即 数 寻 址 (immediate addressing) 使 用 16 位 立即 数 和 寄存 器 作为 操作 数 。 有 些 工 类 型 指令 
(例如 ，adai 指令 和 lui 指令 ) 都 使 用 立即 数 寻 址 。 

3. 基地 址 寻 址 

存储 器 访问 指令 (例如 ，1w 指令 和 sw 指令 ) 都 使 用 基地 址 寻 址 (base addressing) 。 存 储 器 操 
作 数 的 有 效 地 址 由 寄存 器 rs 中 的 基地 址 与 立即 数字 段 中 的 符号 扩展 的 16 位 偏 移 量 相 加 得 到 。 

4. PC 相对 寻 址 

条 件 分 支 指令 在 进行 分 支 时 使 用 PC 相对 寻 址 (PC-relative addressing) 来 确定 PC 的 新 值 。 
立即 数字 段 中 的 有 符号 偏 移 量 与 Pc 值 相 加 得 到 新 的 Pc 值 。 因 此 ， 分支 的 目的 地 址 与 当前 PC 
值 相关 。 

代码 示例 6. 28 描述 了 代码 示例 6.27 中 factorial 函数 的 一 段 代 码 。 图 6-28 给 出 了 beq 
指令 的 机 器 代码 。 如 果 分 支 执行 ， 那 么 分 支 目 标 地 址 (Branch Target Address, BTA) 是 下 一 条 执 
行 指令 的 地 址 。 图 6-28 中 beg 指令 的 分 支 目 标 地 址 是 0xB4 ， 即 标号 else 标号 的 指令 地 址 。 


代码 示例 6. 28 ”计算 分 支 目 标 地 址 


MIPS 汇编 代码 

0xA4 beq $t0, $0, else 

OxA8 addi $v0, $0, 1 

OxAC addi $sp, $sp, 8 

0xB0 JE ‘Sa 

0xB4 else: addi $a0, $a0, —1 

OxB8 jai factorial 

汇编 代码 各 个 字段 的 值 机 器 代码 

op rs "eset imm op rs rt imm 

bea sto, so, eiee[ 4] 8 [0] 3 | fooroofprouopoooo[ oo000000000000r | x1 20003 
6 位 5 位 5 位 16 位 6 位 5 位 5 位 16 位 


图 6-28 beq 指令 的 机 器 代码 


16 位 立即 数字 段 给 出 了 BTA 与 分 支 指令 后 面 的 指令 (PC +4 处 的 指令 ) 之 间 的 指令 数 。 在 
BIE, bea 指令 的 立即 数字 段 的 值 为 3， 因 为 BTA(0xB4) 和 PC +4(0xA8) 之 间 有 3 条 指令 。 
处 理 器 计算 BTA 的 方法 是 ,符号 扩展 16 位 立即 数 并 乘 以 4( 将 字 转 化 为 字 节 ) ， 然 后 将 结 
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RE PC +4 相 加 。 
在 PC 相对 寻 址 方式 中 计算 立即 数字 段 的 值 


计算 下 述 程序 中 bne 指令 中 立即 数字 段 的 值 ， 并 将 此 指令 转化 成 机 器 代码 。 
#MIPS 汇编 代码 


# MIPS assembly code 
0x40 loop: add $t1, $a0, $s0 


0x44 ib $ti, 0¢$t1) 
0x48 add $t2, $al, $s0 
Ox4C sb $t1, 0($t2) 
0x50 addi $s0, $s0, 1 
0x54 bne $tl, $0, loop 
0x58 Iw $s0, 0($sp) 


解 : 图 6-29 给 出 了 bne 指令 的 机 器 代码 ， 它 的 分 支 目标 地 址 0x40 与 Pc +4(0x58) 之 间 有 
6 条 指令 ， 所 以 立即 数字 段 的 值 为 -6。 


汇编 代码 各 个 字段 的 值 机 器 代码 
op TS rt imm op rs rt imm 
me sta, so, 3000 [Cs To To femoris rir ra x rer 
6 位 5 位 5 位 16 位 6 位 Siz 5 位 16 位 
图 6-29 bne 指令 的 机 器 代码 < 
5. 伪 直 接 寻 址 


在 直接 寻 址 (direct addressing) 中 ， 地 址 在 指令 中 是 直接 给 出 的 。 在 理想 情况 下 ， 跳 转 指 令 
5 和 jal 应 该 使 用 直接 寻 址 方式 来 指明 32 位 跳 转 目标 地 址 (Jump Target Address, JTA) LE BK 
转 到 下 一 条 要 执行 的 指令 地 址 。 

不 垃 的 是 ,J 类 型 指令 编码 没有 足够 的 位 数 来 表示 32 位 的 JTA， 指 令 中 有 6 位 用 于 op- 
code, MAIRA 26 位 来 编码 JTA。 幸 运 的 是 ， 最 低 两 位 JTA ,应 该 总 是 为 0， 因 为 指令 是 字 对 
齐 的 。 下 一 个 26 1 JTA :由 指令 的 addr 字段 指出 。 最 高 4 位 JTA;x 由 PCc+4 的 最 高 4 位 得 
到 。 这 种 寻 址 方式 称 为 伪 直 接 寻 址 (pseudo-direct addressing) 。 

代码 示例 6. 29 解释 了 使 用 伪 直 接 寻 址 的 jal 指令 。jal 指令 的 JTA 为 0x004000A0， 图 6-30 
给 出 了 jal 指令 的 机 器 代码 ， 其 中 ITA 的 最 高 4 位 和 最 低 2 位 被 丢弃 ， 剩 下 的 位 存储 在 26 位 
的 地 址 字段 (addqr) 中。 


代码 示例 6. 29 ”计算 跳 转 目标 地 址 ( ITA) 


MIPS 汇编 编码 
0x0040005C jal sum 
OxO004000A0 sum: add $v0, $a0, $al 
汇编 代码 各 个 字段 的 值 机 器 代码 
op addr op addr 
jal sum 0x0100028 000011 | 00 0001 0000 0000 0000 0010 1000 | (0x0C100028) 
6 位 26 位 6 位 26 位 


JTA 0000 0000 0100 0000 0000 0000 1010 0000 (0x004000A0) 
26-bit addr 0000 0000 0100 0000 0000 0000 1010 0000 (0x0100028) 
DA 0 0 OP) 2 8 


图 6-30 jal 机 器 代码 
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处 理 右 计算 J 类 型 指令 ITA 的 方法 是 ,在 26 位 地 址 字段 (addr) 后面 添加 两 个 0， 然 后 取 


PC +4 的 最 高 4 位 放 在 addr 的 前 面 。 


由 于 JTA 的 最 高 4 位 是 由 PC +4 得 来 的 ， 所 以 跳 转 的 范围 受到 限制 。 分 支 和 跳 转 指令 的 受 
限 范围 见习 题 6. 29 到 习题 6.32。 所 有 本 型 指令 (包括 j 指令 和 jal 指令 ) 都 使 用 伪 直 接 寻 址 。 


ER, Dea ats jx 不 是 丁 类 型 指令 


存 的 32 位 值 。 
6.6 FiF, CAMFA 


， 而 是 R 类 型 指令 ， 它 跳 转 到 rs 寄存 器 中 保 


到 目前 为 止 ， 我 们 讲解 了 怎样 将 一 小 段 高 级 语言 代码 转换 成 汇编 语言 和 机 器 代码 。 本 节 将 


介绍 如 何 编译 和 汇编 一 个 完整 的 高 级 语言 程序 ， 


以 及 如 何 将 程序 装 和 存储 器 中 执行 。 


我 们 首先 介绍 MIPS A te At (memory map)， 它 定义 代码 、 数 据 和 栈 内 存 中 的 存储 位 置 ， 


然后 介绍 一 个 简单 程序 的 代码 执行 步骤 。 


6.6.1 内 存 映射 


MIPS 地 址 的 宽度 为 32 位 ， 所 以 MIPS 地 址 
空间 为 2 字 节 =4GB。 字 地 址 为 4GB 除 以 4， 
所 以 字 地 址 的 范围 为 0 ~0xFFFFFFFC。 图 6-31 
展示 了 MIPS 内 存 映射 。MIPS 体系 结构 将 地 址 
空间 分 为 4 部 分 或 者 4 段 : 代码 段 (text seg- 
ment) 、 全 局 数据 段 (global data segment) 、 动 
态 数据 段 ( dynamic data segment ) 和 保留 段 
(reserved segment ) 。 下 面 分 别 介绍 各 段 。 

1. 代码 段 

代码 段 (text segment ) 存储 机 器 语言 程序 。 
它 足 够 大 可 以 容纳 约 256MB 的 代码 。 注 意 ， 
代码 空间 中 的 最 高 4 位 都 为 0， 因 此 j 指令 可 
以 直接 跳 转 到 程序 中 的 任意 地 址 。 

2. 全 局 数据 段 





地 址 正文 段 
OxFFFFFFFC 
0x80000000 | 
0x7FFFFFFC $sp = 0x7FFFFFFC 
0x10010000 Hë 
0x1000FFFC z 
p m hes 全 局 数据 段 $gp = 0x10008000 
OxOFFFFFFC 

代码 段 

0x00400000 | L ， PC = 0x00400000 
0x003FFFFC 


0x00000000 | ROS 
MIPS 内 存 映射 


图 6-31 


全 局 数据 段 (global data segment) 存储 全 局 变量 。 与 局 部 变量 不 同 ， 整 个 程序 均 可 访问 全 局 


变量 。 全 局 变量 在 程序 执行 前 的 启动 (start-up) 中 定义 。 在 C 语言 


这 些 全 局 变量 是 在 主 函 数 


之 外 声明 ， 可 以 被 程序 中 的 任意 函数 访问 。 全 局 数据 段 足 够 大 可 以 容纳 64KB 的 全 局 变量 。 

全 局 变量 使 用 全 局 指针 ( Sop) 访问 ， 该 指针 初始 化 为 0x10008000。 与 栈 指 针 ( $sp) 不 同 ， 
Sgp 在 程序 执行 时 保持 不 变 。 任 何 全 局 变量 都 可 以 基于 Sgp 的 16 位 正 负 偏 移 量 来 访问 。 偏 移 
量 在 汇编 时 确定 ， 因 此 可 以 使 用 带 常 数 偏 移 量 的 基地 址 寻 址 模式 来 访问 全 局 变量 。 


3. 动态 数据 段 


动态 数据 段 (dynamic data segment) 保 存 栈 和 堆 (heap)。 段 中 的 数据 在 程序 启动 时 还 不 能 确 
定 ， 而 是 在 程序 执行 过 程 中 动态 地 分 配 和 回收 。 动 态 数据 段 是 一 个 程序 占用 内 存 最 多 的 段 ， 使 


用 大 约 2GB 的 地 址 空间 。 


如 6.4.6 市 所 述 ， 栈 用 于 保存 和 恢复 函数 使 用 的 寄存 器 ， 并 且 保 存 诸如 数组 之 类 的 局 部 变 
量 。 栈 从 动态 数据 段 (0x7FFFFFFC) 的 顶部 问 下 增长 ， 并 采用 后 进 先 出 (LIFO) 的 顺序 访问 。 

堆 存 储 运 行 时 程序 分 配 的 数据 。 在 C 语言 中 ,使 用 malloc 函数 分 配 内 存 ; 在 C ++ 和 Ja- 
va 语言 中 ， 使 用 new 分 配 内 存 。 类 似 于 宿舍 地 板 上 的 一 堆 衣 服 ， 堆 中 的 数据 可 以 以 任意 顺序 
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使 用 和 丢弃 。 堆 从 动态 数据 段 的 底部 向 上 增长 。 

如 果 栈 和 堆 增长 到 对 方 的 空间 ， 则 程序 中 的 数据 就 会 被 破坏 ( corrupted) 。 如 果 没 有 足够 的 
空间 分 配 更 多 的 动态 数据 ， 那 么 内 存 分 配器 就 通过 返回 内 存 溢出 (out-of- memory ) 错 误 尽量 确保 
不 会 发 生 数 据 被 破坏 的 情况 。 

4. 保留 段 高 级 语言 代码 

保留 段 (reserved segment ) 用 于 操作 系统 ， 不 能 直接 被 程序 使 
用 。 部 分 保留 段 用 于 中 断 ( 见 7.7 节 ) 和 内 存 映 射 7O( 见 8.5 节 )。 


6.6.2 ”转换 成 二 进 制 代码 和 开始 执行 程序 es 


图 6-32 给 出 了 将 程序 从 高 级 语言 转换 成 机 器 代码 并 开始 执 
行 的 主要 步骤 。 首 先 ， 将 高 级 语言 代码 编译 为 汇编 代码 ， 汇 编 代 
码 汇编 为 目标 文件 (object file) 中 的 机 器 代码 。 链 接 程序 将 机 器 代 HARF 库 文 件 
码 和 来 自 库 和 其 他 文件 的 机 器 代码 链接 在 一 起 产生 一 个 完整 可 执 ree 
行文 件 。 实 际 上 ， 大 部 分 编译 器 都 执行 编译 、 汇 编 和 链接 这 三 
步 。 最 后 ， 装 人 程序 将 可 执行 代码 装 人 内 存 中 并 开始 执行 。 本 节 “可 执行 程序 
的 其 余部 分 按照 以 上 步骤 执行 一 个 简单 的 程序 。 

编译 器 将 高 级 语言 代码 转换 成 汇编 语言 ， 代 码 示例 6. 30 描 存 化 器 
述 了 一 个 有 3 个 全 局 变量 和 2 个 函数 的 简单 高 级 语言 程序 ， 以 及 ea RRRA 
由 典型 编译 器 生成 的 汇编 代码 。 关键 字 . data Al. text 是 指明 程序 的 步骤 
数据 段 和 代码 段 开 始 位 置 的 汇编 器 指令 (assembler directives), f, 
g 和 Y 是 全 局 变量 。 它 们 的 存储 位 置 将 由 汇编 器 决定 。 到 目前 为 止 ， 它 们 仅 作 为 代码 中 的 
符号 。 


代码 示例 6. 30 ”编译 高 级 语言 程序 


高 级 语言 代码 MIPS 汇编 代码 

int f, g, y; // global variables ,data 
f: 
g: 
y's 
„text 

int main(void) main: 

{ addi $sp, $sp, -4 #make stack frame 
f =2: sw $ra,O($sp) # store $ra on stack 
jäs: addi $a0, $0, 2 并 $a0 = 2 

SW $a0, f #f=2 
y= sum(f, g); addi $al, $0,3 #$al=3 
return y; sw $al,g #g=3 
} jal sum # call sum function 
sw $v0,y # y =sum(f, g) 


Iw $ra, O($sp) #restore $ra from stack 
addi $sp, $sp, 4 # restore stack pointer 


jr $ra # return to operating system 
int sum(int a, int b) | sum: 
return (a+b); add $v0, $a0, $al # $v0=a+b 
} jr $ra # return to caller 


2. 步骤 2: 汇编 
汇编 磺 将 汇编 语言 代码 换 为 包含 机 器 语言 代码 的 目标 文件 。 汇 编 器 对 汇编 代码 扫描 两 遍 。 
在 第 一 遍 扫 描 中 ， 汇 编 器 分 配 指令 地 址 ， 并 寻找 所 有 的 符号 (symbol) ( 如 标号 和 全 局 变量 名 ) 。 
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经 过 第 一 遍 扫 描 后 代码 如 下 : 


0x00400000 main: addi $sp, $sp, —4 
0x00400004 sw $ra, Hee} 
0x00400008 addi $a0, $0, 
0x0040000C sw $a0, f 
0x00400010 addi $al, $0, 3 
0x00400014 sw $al,g 
0x00400018 jal sum 
0x0040001C sw $v0, y 
0x00400020 lw $ra, O($sp) 
0x00400024 addi $sp, $sp, 4 
0x00400028 in > $ra 
0x0040002C sum: add $v0, $a0, $al 
0x00400030 jr $ra 


符号 的 名 字 和 地 址 保存 在 符号 表 (symbol table) 中 ， 如 表 6-4 所 示 。 在 第 一 遍 扫 描 后 ， 如 果 
标号 地 址 已 经 确定 ， 就 填充 对 应 的 符号 地 址 。 在 内 存 的 全 局 数据 段 中 给 全 局 变量 分 配 存储 位 
置 ， 其 中 内 存 起 始 地 址 为 0x10000000。 


在 第 二 遍 扫 摘 中 ， 汇 编 器 产生 机 器 语言 代码 。 全 局 变 表 6-4 符号 表 
量 和 标号 的 地 址 可 以 从 符号 表 中 获得 。 机 器 语言 代码 和 符 。。 符号。 地 址 o o 
号 表 存 储 在 目标 文件 中 。 £ 0x10000000 
3. RS: 链接 g 0x10000004 
大 多 数 大 的 程序 包括 不 止 一 个 文件 。 如 果 程 序 员 只 改变 y 0x10000008 
main 0x00400000 


其 中 的 一 个 文件 ,那么 重新 编译 和 汇编 其 他 文件 就 是 一 种 浪 
费 。 实 际 上 ， 程 序 总 是 调用 库 文 件 中 的 藉 数 ， 而 这 些 库 文 
件 几 乎 是 不 变 的 。 如 果 高 级 语言 代码 的 文件 不 变 ， 那 么 与 之 相关 联 的 目标 文件 就 不 需要 更 新 。 

链接 句 的 工作 是 将 所 有 的 目标 文件 合并 成 一 个 机器 语言 文件 ， 该 文件 称 为 可 执行 文件 (ex- 
ecutable) 。 链 接 吉 重 新 定位 目标 文件 中 的 数据 段 和 指令 段 使 它们 不 再 彼此 相 接 。 它 使 用 符号 表 
中 的 信息 来 调整 重新 定位 后 的 全 局 变量 和 标号 地 址 。 

我 们 的 例子 只 有 一 个 目标 文件 ， 所 以 不 需要 重 定位 。 图 6-33 展示 了 一 个 可 执行 文件 ， 此 
文件 有 3 部 分 : 可 执行 文件 头 、 代 码 段 和 数据 段 。 可 执行 文件 头 包含 文件 大 小 (代码 大 小 ) 和 数 
iiaiai , 两 者 均 用 字 节 表示 。 ie 的 存储 地 址 。 


sum 0x0040002.C 


0x23BDFFFC i $sp, $sp, -4 
0xAFBF0000 $ra, O(S$sp) 
0x20040002 i $a0, $0, 2 
OxAF848000 $a0, 0x8000(Sqp) 
0x20050003 i, Sai, $0, 3 
OxAF858004 $al, 0x8004(S$qp) 
0x00400018 0x0C10000B j 0x0040002C 
0x0040001C OxAF828008 $v0, 0x8008(S$qp) 
Ox8FBF0000 Sra, 0(Ssp) 
0x23BD0004 idi $sp, $sp, -4 
0x03E00008 j $ra 
0x00851020 $v0, $a0, Sal 
0x03E00008 j $ra 





图 6-33 ”可 执行 文件 
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图 6-33 在 机 器 代码 旁边 给 出 了 人 类 可 读 的 汇编 指令 格式 以 便于 理解 ， 但 是 可 执行 文件 只 
包括 机 器 代码 。 数 据 段 给 出 了 每 个 全 局 变量 的 地 址 。 全 局 变量 根据 全 局 指针 Sgp 给 出 的 基地 
址 来 寻 址 。 例 如 ， 第 一 条 存储 指令 sw $a0, 0x8000( $gp) 将 值 2 存储 在 全 局 变量 于 中 , E 
内 存 中 的 地 址 为 0x10000000。 注 意 ， 偏 移 量 0x8000 是 一 个 16 位 有 符号 数值 ， 将 此 偏 移 量 符号 
扩展 后 与 基地 址 sgp 相 加 ， 即 $gp +0x8000 =0x10008000 + OxFFFF8000 = 0x10000000 ， 此 值 就 


是 变量 £ 的 内 存 地 址 。 

4. 步骤 4: HA 

操作 系统 通过 从 存储 设备 (一 般 是 硬盘 ) 
读 取 可 执行 文件 的 代码 段 将 程序 装 人 内 存 的 
代码 段 中 。 操 作 系 统 将 sop 设置 为 
0x10008000( 全 局 数据 段 的 中 间 ) ， 将 Ssp it 
为 0x7FFFFFFC( 动 态 数据 段 的 顶部 ) ， 然 后 执 
行 jal 0x00400000 跳 转 到 程序 的 开头 。 图 
6-34 展示 了 程序 开始 执行 时 的 内 存 映射 。 


6.7 其 他 主题 

本 节 包 括 了 一 些 本 章 其 他 节 没有 涵盖 的 
内 容 ， 主 要 包括 伪 指 令 、 异 常 、 有 符号 和 无 
符号 算术 指令 ， 以 及 浮 点 指令 。 


6.7.1 HHE 


如 果 一 条 汇编 指令 在 MIPS 指令 集中 找 不 
到 ， 很 可 能 是 因为 可 以 用 一 条 或 者 多 条 已 有 
的 MIPS 指令 来 实现 相同 的 操作 。MIPS 是 精 
简 指 令 集 计算 机 (RISC) ， 所 以 通过 保持 指令 
数 最 少 来 降低 指令 大 小 和 硬件 的 复杂 性 。 

然而 ，MIPS % X T 44 4% 4 ( pseduoinstruc- 
tion ) 。 伪 指令 并 不 是 实际 指令 集 的 一 部 分 ， 但 
通常 由 程序 员 和 编译 器 使 用 。 在 转换 为 机 器 代 
码 时 ， 将 伪 指 令 转换 为 一 条 或 多 条 MIPS 指令 。 

表 6-5 给 出 了 伪 指 令 以 及 使 用 MIPS 指令 
实现 这 些 伪 指令 的 例子 。 例 如 ， 装 人 立即 数 伪 
指令 (1i) 装 入 一 个 32 位 和 常数， 它 使 用 lui 和 
ori 的 组 合 来 实现 。 无 操作 伪 指 令 (nop ) 不 做 
任何 操作 ， 执 行 这 条 伪 指 令 时 ，PC 增加 4。 不 
会 改变 其 他 寄存 器 或 内 存 的 值 。nop 指令 的 机 
器 代码 为 0x00000000 。 

有 些 伪 指令 要 求 一 个 临时 寄存 器 来 保存 中 
间 结 果 。 例 如 ， 伪 指令 beq $t2, imn,,.,, 
loop 将 $t2 与 16 位 立即 数 immi。, 比较。 这 
条 伪 指 令 需 要 一 个 临时 寄存 器 来 存储 这 个 16 
位 立即 数 。 为 此 ， W Sm ah eA YC Sn ah BF FF at 
Sat 来 存储 结果 ， 表 6-6 描述 了 汇编 器 如 何 使 


地 址 








Ox7FFFFFFC | $sp = 0x7FFFFFFC 


0x 10010000 


$gp = 0x10008000 





OxAF828008 
0x0C10000B 





0x00400000 


23 PC = 0x00400000 


图 6-34” 装 和 人 内存 的 可 执行 程序 


#6-5 伪 指 令 
对 应 的 MIPS 指令 
lui $s0, 0x1234 


伪 指 令 
li $s0O, 0x1234AA77 
ori $s0, OxAA77 
add $t0, $0, $0 
add $s2, $sl, $0 
sll $0, $0, 0 


clear $t0 
move $s2, $sl 


nop 


6-6 使 用 Sat 的 伪 指令 
伪 指 令 对 应 的 MIPS 指令 
beq $t2, immis.o, Loop addi Sat, $0, imms., 


beq $t2, Sat, Loop 


341 


342 
: 
344 
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用 Sat 将 伪 指令 转换 为 真正 的 MIPS 指令 。 习 题 6. 3 和 习题 6. 39 将 实现 循环 左 移 ( rol ) 和 循环 
Aror) FAHS. 


6.7.2 异常 


异常 (exception ) 就 像 一 个 不 按 计划 出 现 的 函数 调用 ， 它 可 以 跳 转 到 一 个 新 的 地 址 。 异 稍 可 
能 由 硬件 或 软件 引起 。 例 如 ， 当 用 户 按 下 键盘 上 的 按键 时 ， 处 理 器 可 能 接收 到 这 个 消息 ， 然 后 
停 下 正在 处 理 的 程序 来 判断 哪个 按键 被 按 下 ， 保 存 它 以 便 将 来 使 用 ， 然 后 恢复 当前 程序 的 执 
行 。 由 键盘 等 的 IO 设备 触发 的 硬件 异常 称 为 中 断 (interrupt) 。 另 外 ， 当 程序 遇 到 没有 定义 指 
令 等 的 错误 时 ， 程 序 就 会 跳 转 到 操作 系统 (Operating System, OS) 中 的 代码 ， 由 操作 系统 中 的 代 
码 决 定 是 否 结束 终止 违规 的 程序 。 软 件 异常 有 时 称 为 自 陷 (trap)。 其 他 导致 异常 的 原因 包括 被 
0 除 、 尝 试 读 不 存在 的 内 存 、 硬 件 故 障 、 调 试 器 断 点 和 算术 溢出 ( 见 6.7.3 节 ) 等 。 

异常 发 生 时 ， 处 理 器 记录 导致 异常 的 原因 和 当时 的 PC 值 ， 然 后 它 跳 转 到 异常 处 理 程序 
(exception handler)。 异 常 处 理 程序 (往往 是 操作 系统 的 一 个 部 分 ) 主 要 检测 导致 异常 的 原因 ， 
并 做 出 适当 的 反应 (例如 ， 在 硬件 中 断 时 读 键 盘 ) 。 在 处 理 完 异常 后 ， 将 返回 异常 发 生前 正在 
执行 的 程序 - 在 MIPS 中 ,异常 处 理 程序 总 是 位 于 0x80000180。 当 异常 发 生 时 ， 无论 哪 种 情况 
引起 的 异常 ， 处 理 器 总 是 跳 转 到 这 个 地 址 。 


MIPS 体系 结构 使 用 称 为 cause 寄存 器 的 专用 表 6-7 异常 原因 代码 
( special- purpose) 寄存 器 来 记录 导致 异常 的 原因 。 使 . 异常 cause 寄存 器 中 的 值 
用 不 同 代码 记录 不 同 的 异常 原因 ， 如 表 6-7 R, F EE oF HH 0x00000000 
党 处 理 程 序 读 cause 寄存 器 来 决定 怎样 处 理 异 常 。 系统 调用 0x00000020 
其 他 一 些 体 系 结构 根据 不 同 的 异常 原因 跳 转 到 不 同 的 。 PEO A ign 
异常 处 理 程序 ， 而 不 使 用 cause 寄存 器 来 区 分 异常 | OS men 


FA, 

MIPS 使 用 称 为 异常 程序 计数 器 (Exception Program Counter, EPC) 的 专用 寄存 器 来 存储 异常 
发 生 时 的 Pc 值 。 在 处 理 完 异 常 后 ， 处 理 器 返回 到 EPC 中 的 地 址 。 这 与 在 jal 指令 执行 时 使 用 
Sra 来 存储 PC 的 旧 值 很 相似 。 

EPC 和 cause 寄存 器 不 属于 MIPS 寄存 器 文件 。mfc0 (move from coprocessor 0， 从 处 理 器 0 
中 移出 ) 指 令 将 EPC 寄存 器 、cause 寄存 器 和 其 他 专用 寄存 器 复制 到 一 个 通用 寄存 器 ( general 
purpose registers) 中 。 协 处 理 器 0 PKA MIPS 处 理 器 控制 (MIPS processor control) ， 它 处 理 中 断 和 
诊断 处 理 需 错误 。 例 如 ，mfc0 $t0, cause 将 cause 寄存 器 内 容 复制 到 sto 中 。 

syscall 和 break 指令 产生 上 自 陷 来 执行 系统 调用 或 者 调试 器 断 点 。 异 常 处 理 程序 使 用 
EPC 来 寻找 发 生 异 常 的 指令 ， 并 通过 检查 指令 的 各 个 字段 来 决定 进行 系统 调用 还 是 进入 断 点 。 

总 之 ,异常 使 处 理 器 跳 转 到 异常 处 理 程序 。 异 常 处 理 程序 将 寄存 器 内 容 保存 到 栈 中 ， 然 后 
使 用 mfc0 指令 来 检查 导致 异常 的 原因 ， 并 做 出 相应 的 反应 。 当 异常 处 理 程序 执行 完 后 ， 它 从 
栈 中 恢复 寄存 器 的 内 容 ， 使 用 mfc0 指令 从 EPC 中 复制 返回 地 址 到 $k0， 使 用 jr sko 指令 
返回 。 


6. 7.3 有 符号 指令 和 无 符号 指令 

前 面 提 到 ， 二 进 制 数 可 能 是 有 符号 的 或 者 无 符号 的 。MIPS 体系 结构 使 用 补 码 表示 有 符号 
数 。MIPS 也 有 一 些 指令 用 于 处 理 有 符号 和 无 符号 类 型 ， 包 括 加 法 、 减 法 、 乘 法 、 除 法 、 小 于 
设置 和 半 字 装 人 等 。 

1. 加 法 和 减法 

无 论 有 符号 数 还 是 无 符号 数 ， 加 法 和 减法 操作 是 相同 的 ， 但 对 于 结果 的 解释 却 是 不 同 的 。 
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14.6 节 中 提 到 ， 如 果 两 个 大 的 有 符号 数 相 加 ， 结 果 可 能 是 错误 的 。 例 如 ， 下 面 两 个 较 大 
的 正 数 相 加 ， 结 果 却 是 负 的 : Ox7FFFFFFF +0x7FFFFFFF =0xFFFFFFFE = -2。 同 样 ， 两 个 较 大 
的 负数 相 加 可 能 产生 正 的 结果 : 0x80000001 + 0x80000001 = 0x00000002。 这 种 情况 称 为 算术 溢 
出 (overflow ) - 

C 语言 忽略 算术 溢出 ,但 其 他 语言 (例如 ，FORTRAN ) 则 要 求 程序 报告 溢出 。6.7.2 节 提 
Fj, MIPS 处 理 器 根据 异常 来 处 理 溢出 。 程 序 可 以 决定 如 何 处 理 溢出 (例如 ， 可 以 使 用 更 高 的 精 
度 重新 计算 来 避免 溢出 )， 然 后 返回 程序 停止 的 地 方 。 

MIPS 提供 有 符号 和 无 符号 的 加 法 和 减法 指令 ， 有 符号 的 指令 包括 add, addi 和 sub. 无 
符号 指令 包括 addu, addiu 和 subu。， 溢 出 时 ， 有 符号 指令 出 发 异常 ， 而 无 符号 指令 不 发 出 
异常 。 除 此 之 外 ， 两 类 指令 基本 相同 ; 由 于 C 语言 忽 略 异常 ， 所 以 C 程序 使 用 MIPS 指令 中 的 
无 从 号 指令 来 实现 . 

2. 乘法 和 除法 

乘法 和 除法 对 于 有 符号 和 无 符号 数 的 操作 是 不 同 的 。 例 如 ，0xFFFFFFFF 作为 一 个 无 符号 
数 时 表示 一 个 大 数字 , 但 是 作为 一 个 有 符号 数 时 表示 - 1。 因此， 如 果 是 无 符号 数 ， 
OxFFFFFFFF x OxFFFFFFFF 的 结果 为 0xFFFFFFFE00000001; 如 果 是 有 符号 数 ， 结 果 则 
为 0x0000000000000001 。 

因此 ， 需 要 对 有 符号 数 和 无 符号 数 采用 不 同 的 乘法 和 除法 指令 操作 。mult 和 div 对 有 符 
号 数 进行 操作 ， 而 multu 和 divu 对 无 符号 数 进行 操作 。 

3. 小 于 设置 

小 于 设置 ( set less than) 指令 可 以 比较 两 个 寄存 器 (slt) 或 者 一 个 寄存 器 和 一 个 操作 数 
(slti) 的 大 小 。 小 于 设置 指令 也 分 为 有 符号 (slt 和 slti) 和 无 符号 (slLltu 和 sltiu) AF 
形式 。 对 于 有 符号 数 的 比较 ，0x80000000 小 于 任意 数字 ， 因 为 它 是 最 小 的 负数 ;对 于 无 符号 数 
的 比较 ，0x80000000 大 于 0x7FFFFFFF 但 是 小 于 0x80000001， 因 为 所 有 的 数字 都 是 正 数 。 

需要 注意 的 是 ，sltiu 将 立即 数 先进 行 符 号 扩展 ， 然 后 把 它 当 作 无 符号 数 进行 操作 。 例 如 ， 
sltiu $s0, sl, 0x8042 将 $sl 和 0xFFFF8042 比较 ， 其 中 立即 数 为 一 个 较 大 的 正 数 。 

4. RA 

如 6.4.5 节 所 述 ， 字 节 装 和 分 为 有 符号 (lb ) 和 无 符号 (LIbu) 两 类 。1b 对 字 节 数据 进行 符 
号 扩展 ， 而 lbu 对 字 节 数据 进行 0 扩展 来 填充 32 位 寄存 器 。 同 样 ，MIPS 提供 有 符号 和 无 符号 
的 半 字 装 人 指令 (1h 和 1hu) ， 这 类 指令 将 两 个 字 节 的 数据 装 人 寄存 器 的 低 半 字 ， 然 后 进行 符 
号 扩展 或 者 0 扩展 来 填充 寄存 器 的 高 半 字 。 


6.7.4 浮 点 指令 


MIPS 体系 结构 定义 了 一 个 可 选 的 浮 点 协 处 理 器 ， 称 为 协 处 理 器 1(coprocessor 1 ) 。 在 早期 
MIPS 的 实现 中 ， 浮 点 协 处 理 器 是 一 个 独立 的 芯片 ， 如 果 用 户 需 要 快速 的 浮 点 计算 能 力 ， 他 们 
可 以 单独 购买 。 在 大 多 数 现代 MIPS 实现 中 ， 浮 点 协 处 理 器 集成 在 主 处 理 右 旁边 。 

MIPS 定义 32 个 32 位 浮 点 寄存 器 SEO ~ 


$231, RESHMA eS MPS 
用 寄存 器 。MIPS 支持 单 精度 和 双 精 度 SER E 
IEEE 浮 点 运算 。64 位 的 双 精度 数 存储 在 。 ssto - stt3 4, 6, 8, 10 临时 变量 
两 个 32 位 寄存 器 构成 的 寄存 器 对 中 ， 所 sfa0 - Sfal 12, 14 PK ALE 
以 只 有 16 个 偶数 编号 的 寄存 器 ( $Sf0、  sft4- sft5 16, 18 临时 变量 


sf2、 $f4, =, $f30 ) 用 于 指定 双 精 $fs0 - $fs5 20, 22, 24, 26, 28, 30 保存 变量 


214 ROE 





EZA, WK 6-8 所 示 。 
浮 点 指令 的 opcode 字段 均 为 17(10001, ) 。 它 们 需要 funct 字段 和 fop HME) PEt 
来 指明 指令 的 具体 类 型 。 因 此 ，MIPS 为 浮 点 指令 定义 下 类 型 指令 格式 ， 如 图 6-35 MR FA 
指令 分 为 单 精度 和 双 精 度 两 种 类 型 ， 单 精度 指令 的 fop 字段 为 16(10000, ) ， 双 精度 指令 的 
cop 字段 17(10001; ) 。 与 R 类 型 指令 一 样 ，E 类 型 指令 有 两 个 源 操作 数 fs 和 ft， 以 及 一 个 目 
的 操作 数 fd. 
F 类 型 


ml rT | Re 


6 位 5 位 5 位 5 位 5 位 6 位 
图 6-35 下 类 型 机 需 指 令 格式 


指令 精度 由 助 记 符 中 的 .s 和 .a 来 指定 。 浮 点 运算 指令 包括 加 法 (add. s, add. d), WA 
(sub. sz7 sub. d), R ( mül. ss muid); 除法 (div. s, div.d), MR (neg. s, 
neg. d) 和 取 绝 对 值 (abs. s, abs. d)。 

浮 点 运算 的 分 文 有 两 个 部 分 。 首 先 ， 比 较 指令 用 于 设置 或 清除 浮 点 条 件 标 志 ( fpcond)。 
然后 ， 条 件 分 支 检测 fpcond 标志 的 值 。 比 较 指令 包括 等 于 (c. seq. s、c. seq. d) 、 小 于 
(c. 1t. s、c. 1t. d) 、 小 于 或 等 于 (c. le.s, c. le. d)。 如 果 fpcond X FALSE 或 TRUE， 对 
应 的 条 件 分 支 指 令 分 别 为 pclf 和 bclt。 在 不 相等 、 大 于 或 等 于 、 大 于 的 判断 过 程 中 ， 首 先 
执行 seq、1t 或 le 指令 ， 后 面 跟随 bclf 指令 。 

使 用 lwcl 和 swol 指令 实现 浮 点 寄存 舌 从 内 存 中 装 人 和 存储 。 这 些 指令 每 次 移动 32 位 ， 
因此 需要 两 条 指令 完成 对 双 精 度数 的 处 理 。 


6.8 ”从 现实 世界 看 : x86 结构 


目前 ， 几 乎 所 有 的 个 人 计算 机 都 在 使 用 x86 结构 的 微 处 理 器 。x86， 也 称 为 IA-32， 是 一 个 
32 位 体系 结构 ， 最 初 由 Inel 公司 研发 。AMD 也 销售 与 x86 兼容 的 微 处 理 需 。 

x86 体系 结构 漫长 而 曲折 的 历史 可 以 追溯 到 1978 Æ., MHF, Intel 推出 了 16 位 8086 微 处 理 
fro IBM 选择 8086 和 它 的 姊妹 产品 8088 作为 IBM 的 第 一 代 个 人 计算 机 。1985 4F, Intel 公司 推 
出 32 位 微 处 理 器 80386。 它 对 8086 向 后 兼容 ， 可 以 运行 为 早期 PC 开发 的 软件 。 兼 容 80386 的 
处 理 器 体系 结构 称 为 x86 处 理 器 。Pentium、Core 和 Athlon 处 理 器 都 是 著名 的 x86 处 理 器 。7.9 
节 将 详细 介绍 x86 微 处 理 器 的 发 展 。 

经 过 许多 年 ，Intel A AMD 把 更 多 的 新 指令 和 功能 都 塞 进 了 这 个 陈旧 的 体系 结构 中 ， 其 结 
果 就 是 这 种 体系 结构 与 MIPS 相 比 很 不 优雅 。 就 像 Patterson 和 Hennessy 所 说 , “这 种 混杂 的 祖 
谱 使 得 体系 结构 很 难 解 释 ， 也 不 可 能 喜欢 它 。” 然 而 ， 软 件 的 兼容 性 比 技术 的 优雅 性 更 加 重要 ， 
所 以 x86 在 这 20 年 中 都 是 PC 机 的 事实 标准 。 每 年 卖 出 的 x86 处 理 器 超过 1 亿 片 ， 巨 大 的 市 场 
保证 了 每 年 50 亿美 元 的 研究 开发 经 费 来 对 处 理 器 进行 不 断 的 改进 。 

x86 是 复杂 指令 集 计 算 机 (Complex Instruction Set Computer, CISC) 体系 结构 。 与 诸如 MIPS 
的 精简 指令 集 计 算 机 (Reduced Instruction Set Computer, RISC) 体系 结构 相 比 ， 每 一 条 CISC 指令 
可 以 做 更 多 的 工作 。CISC 体系 结构 的 程序 一 般 需 要 较 少 的 指令 ， 指 令 编码 更 加 紧凑 。 这 样 可 
以 节省 内 存 ， 尤 其 在 RAM 比较 贵 时 ，CISC 更 有 优势 。CISC 体系 结构 的 指令 长 度 是 可 变 的 ， 一 
般 都 小 于 32 位 。 但 其 代价 是 复杂 指令 系统 更 难 译 码 而 且 指 令 执 行 速 度 更 慢 。 

本 节 介 绍 x86 体系 结构 。 目 标 不 是 让 读者 成 为 x86 汇编 语言 程序 员 ， 而 是 说 明 x86 与 MIPS 
的 一 些 相似 点 和 不 同 点 。 我 们 认为 了 解 x86 的 工作 方式 是 一 件 很 有 趣 的 事情 , 但 是 本 节 的 内 容 
不 妨碍 对 后 面 章节 的 理解 。x86 与 MIPS 的 主要 差异 如 表 6-9 所 示 。 
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6-9 MIPS 5 x86 的 主要 差异 





特征 MIPS x86 
寄存 器 数 32 个 通用 寄存 器 8 个 (在 用 途上 有 一 些 限 制 ) 
操作 数 的 个 数 3 个 (2 个 源 ,1 个 目的 ) 2 个 (1 个 源 ,1 个 源 /目的 ) 
| 操作 数位 置 寄存 器 或 立即 数 寄存 器 、 立 即 数 或 存储 器 
| 操作 数 大 小 32 位 8、16 或 32 位 
| 条 件 码 无 有 
指令 类 型 简单 简单 类 型 和 复杂 类 型 
指令 编码 固定 的 ，4 字 节 长 可 变 长 ，1 ~ 15 字 节 
6.8.1 x86 寄存 器 A ia 让 A 
8086 微 处 理 器 提供 8 个 16 MAA AEAT AnA Ak SA EAX 
8 位 和 低 8 位 字 节 。 当 32 位 80386 产生 后 ， 这 些 寄存 器 扩展 为 32 位 ，“ ao. 
PRAY EAX, ECX, EDX, EBX, ESP, EBP, ESI 和 EDI。 为 了 保证 向 二 
后 兼容 性 ， 寄 存 器 的 低 16 位 和 一 些 低 8 位 部 分 也 是 可 用 的 ， 如 图 6-36 1 CX 
所 示 。 CH| CL 
这 8 个 寄存 器 大 部 分 (但 并 不 完全 ) 是 通用 寄存 器 。 某 些 指令 不 能 EDX 
够 使 用 某 些 寄存 器 。 其 他 指令 总 是 将 结果 放 入 某 些 寄 存 器 中 。 与 MIPS “ a i 
中 的 $sp 一 样 ，ESP 寄存 器 通常 用 于 保存 栈 指针 。 一 - 
x86 的 程序 计数 器 称 为 扩展 指令 指针 (Extended Instruction Pointer, 3 BX 
EIP), $j MIPS 中 的 pc 一 样 ，EIP 从 一 条 指令 向 下 一 条 指令 递增 ,或 BHJ BL 


者 通过 分 文 、 跳 转 或 函数 调用 指令 来 改变 运行 路 径 。 
6.8.2 x86 操作 数 


> 


MIPS 指令 总 是 对 寄存 器 或 立即 数 进行 操作 。 需 要 显 式 地 装 入 和 5 人 
存储 指令 来 完成 内 存 与 寄存 器 之 间 的 数据 移动 。 相 反 ，x86 指令 可 以 
对 寄存 器 、 立 即 数 或 者 内 存 进行 操作 。 这 对 于 较 少 的 寄存 器 集 是 一 ESI 
种 补偿 。 
MIPS 指令 一 般 指定 3 个 操作 数 : 2 个 源 操作 数 和 一 个 目的 操作 数 。 a 
x86 指令 只 指定 了 2 个 操作 数 ， 第 一 个 操作 数 是 源 操作 数 ， 第 二 个 操作 7 DI 
数 既是 源 操作 数 又 是 目的 操作 数 ， 因 此 ，x86 指令 总 是 将 结果 覆盖 其 中 
一 个 源 操作 数 。 表 6-10 列 出 了 x86 中 操作 数位 置 的 组 合 。 除 了 从 内 存 。 图 6-36 x86 寄存 器 


到 内 存 外 ， 所 有 组 合 方式 都 有 可 能 。 
表 6-10 操作 数位 置 


源 / 目 的 源 例子 含义 

ay FF tt 寄存 器 add EAX, EBX EAX <- EAX + EBX 

寄存 器 立即 数 add ERX，42 BAX <- EAX + 42 

寄存 器 存储 器 add EAX, [20] EAX <- EAX + Mem[20] 
存储 器 寄存 器 add [20], EAX Mem[20] <- Mem[20] + EAX 
存储 器 立即 数 add [20], 42 Mem[20] <- Mem[20] + 42 


与 MIPS 类 似 ，x86 有 字 节 寻 址 的 32 位 内 存 空 间 ， 但 是 x86 文 持 更 多 种 内 存 寻 址 方式 (ad- 
dressing mode) 。 内 存 位 置 由 基地 址 寄存 器 (base register), 4% 4% ( displacement ) Al & Hh F A SB 


w 
E 
O 
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(scaled index register) 组 合 确定 ， 如 表 6-11 所 示 。 位 移 可 以 是 8 位 、16 位 或 者 32 位 值 。 与 变 址 
寄存 器 (index register) 相 乘 的 数 可 以 是 1、2、4 或 8。 用 于 存储 器 装 人 和 存储 的 基 址 + 位 移 方式 
与 MIPS 中 的 基地 址 寻 址 方式 相同 。 变 址 寻 址 提供 了 一 种 简单 方法 访问 2、4、8 字 节 元 素 的 数 


组 或 结构 ， 而 不 需要 多 条 指令 来 产生 地 址 。 





表 6-11 存储 器 寻 址 方式 
例子 含义 解释 
add EAX, [20] EAX <- EAX + Mem[20] 位 移 
add EAX, [ESP] EAX <- EAX + Mem[ESP] 基地 址 
add EAX, [EDX +40] EAX <- EAX + Mem[EDX +40] 基地 址 + 偏 移 
add EAX, [60 +EDI* 4] EAX <- EAX + Mem[60 +EDI* 4] 基地 址 + 变 址 
add EAX, [EDX +80 +EDI* 2] EAX <- EAX + Mem [EDX +80 +EDI* 2] 基地 址 + 偏 移 + 变 址 


虽然 MIPS 总 是 对 32 位 数 进行 操作 ， 但 x86 指令 可 以 对 8 位 、16 位 
详细 说 明 见 表 6-12, 


表 6-12 对 8 位 、16 位 和 32 位 数据 操作 的 指令 


、32 位 数据 进行 操作 : 


例子 含义 数据 大 小 
add AH, BL AH <- AH + BL 8 位 
add AX, -1 AX <- AX + OxFFFF 16 位 
add EAX, EDX EAX <=- EAX + EDX 32 位 


6.8.3 状态 标志 


与 很 多 CISC 体系 结构 一 样 ，x86 使 用 状态 标志 (status flag)， 也 称 为 条 件 码 (condition 
code) ， 判 断 分 支 转移 并 保存 进位 和 算术 溢出 。x86 使 用 称 为 EFLAGS AY 32 位 寄存 器 存储 状态 


标志 。EFLAGS 寄存 器 中 的 一 些 位 由 表 6-13 给 出 ， 其 他 位 被 操作 系统 使 用 - 
表 6-13 部 分 EFLAGS 标志 位 
AF 含义 
cE( 进位 标志 ) 由 最 近 一 次 算术 操作 引起 的 进位 标志 : 在 无 符号 算术 运算 中 表示 溢出 - 也 用 于 多 精度 算术 
计算 中 在 不 同 字 之 间 传 播 进 位 
ZEF( 零 标志 ) 最 后 一 个 操作 的 结果 为 0 
SF( 符 号 标志 ) 最 后 一 个 操作 的 结果 为 负数 ( 最 高 有 效 位 为 1) 


OF ( 溢出 标志 ) 在 二 进 制 补 码 算 术 运 算 中 产生 溢出 


x86 处 理 器 的 体系 结构 包括 了 EFLAGS 寄存 嚣 、 前 面 介 绍 的 8 个 寄存 器 和 EIP 寄存 器 - 


6.8.4 x86 指令 集 


x86 指令 集 比 MIPS 指令 集 大 。 表 6-14 描述 了 一 些 通用 指令 。x86 还 有 浮 点 算术 指令 和 将 


多 个 短 数据 合成 一 个 长 数据 的 运算 指令 。 
作 数 ( 寄存器、 内 存 位 置 ， 或 者 立即 数 ) 。 


D 表示 目的 操作 数 ( 寄存器 或 内 存 位 置 ) ，S 表示 源 操 


注意 ， 有 些 指令 总 是 需要 对 特定 寄存 器 进行 操作 - 例如，32 x32 位 乘法 总 是 从 EAX 寄存 
器 中 取出 源 操 作 数 ， 然 后 总 是 把 64 位 结果 放 人 EDX 和 EAX FP. LOOP 总 是 将 循环 计数 器 存储 


Æ ECX 中 。PUSH、POP、CALL 和 RET 使 用 栈 指针 寄存 器 ESP, 
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指令 
ADD/SUB 
ADDC 
INC/DEC 
CMP 
NEG 
AND/OR/XOR 
NOT 
IMUL/MUL 
IDIV/DIV 


SAR/SHR 
SAL/SHL 
ROR/ROL 
RCR/RCL 
BT 
BTR/BTS 
TEST 
MOV 
PUSH 
POP 
CLC, STC 


RET 


# 6-14 部 分 x86 指令 
含义 
加 法 /减法 
带 进位 加 法 
递增 /递减 
比较 
取 反 
iv 44 AND/OR/XOR 
逻辑 NOT 
有 符号 /无 符号 乘法 
有 符号 /无 符号 除法 


算术 /逻辑 右 移 

左 移 

循环 左 移 / 右 移 

带 进位 的 循环 左 移 / 右 移 
位 测试 

位 测试 并 复位 /设置 
基于 屏蔽 位 设置 标志 位 
数据 移动 

入 栈 

出 栈 

清除 /设置 进位 标志 
无 条 件 跳 转 


条 件 跳 转 
循环 


盟 数 调用 


PR RUR [e] 
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功能 
D=D+S/D=D=5 
D=D+S + CF 
D =D +140 a p —1 
根据 D - s 设置 标志 位 
D= -D 
D=Dops 
coe 
EDX: EAX = EAX xD 
EDX: EAX/ D 
EAX = Ñ; EDX= 余 数 
D= D >>> S/D = D >> 8 
D= p<e<s 
D HEM BAH s 位 
CF Al D 循环 移动 fi 
CF = DIS1(D 的 第 fi) 
CF = D[S]; DIS] =0/1 
基于 D AND s 设置 标志 位 
D = S 
ESP = ESP -4; Mem[ESP] = 5 
D = MEM[ESP]; ESP = ESP + 4 
CF =0/1 
相对 跳 转 ; EIP = EIP + S 
绝对 跳 转 : EIP = S 
if (flag) EIP = EIP + S 
ECX = ECX - 1 
if (ECX # 0) EIP = EIP + imm 
ESP = ESP- 4 
MEM[ESP] = EIP; EIP = S 
EIP = MEM[ESP]; ESP = ESP + 4 


条 件 跳 转 指令 检查 标志 位 ， 如 果 条 件 满足 则 跳 转 。 跳 转 指令 有 很 多 种 。 比 如 ， 如 零 标志 位 
(ZF) 为 1 则 Jz 跳 转 ; 如 果 零 标志 位 为 0 则 nz 跳 转 。 跳 转 指令 一 般 都 是 跟 在 某 条 指令 的 后 
面 ， 如 用 于 设置 标志 位 的 比较 指令 (CMP)。 表 6-15 列 出 了 一 些 条 件 跳 转 指令 ， 以 及 这 些 指令 
所 依赖 的 先前 比较 操作 设置 的 标志 位 。 


表 6-15 部 分 分 支 指 令 的 条 件 


指令 pa 比较 D、s 后 的 功能 
JZ/ JE 如 果 ZF = 1， 则 跳 转 如 果 D = s， 则 跳 转 
JNZ/ JNE 如 果 ZzF = 0， 则 跳 转 如 果 D 关 S， 则 跳 转 
JGE 如 果 SF = OF， 则 跳 转 wE D> S， 则 跳 转 
JG 如 果 SF = OF and ZF = 0， 则 跳 转 如 果 D > S， 则 跳 转 
JLE 如 果 SF # OF or ZF = 1， 则 跳 转 如 果 D < s， 则 跳 转 
JL 如 果 sr ~ OF， 则 跳 转 如 果 D < S， 则 跳 转 
JC/JB 如 果 cF = 1， 则 跳 转 
JNC 如 果 cF = 0， 则 跳 转 
JO 如 果 oF = 1， 则 跳 转 
JNO mor = 0, WHEE - 
JS 如 果 sF = 1， 则 跳 转 


JNS 如 果 sF = 0， 则 跳 转 
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6.8.5 x86 指令 编码 


数 十 年 内 x86 指令 不 断 修 改 ， 所 以 其 编码 非常 杂乱 。 与 MIPS 指令 固定 32 位 长 度 不 同 ， 
x86 指令 长 度 在 1 ~ 15 字 节 之 间 变 化 ， 如 图 6-37 所 示 ”。opcode 可 能 是 1 字 节 、2 字 节 或 者 3 
字 节 。Opcode 的 后 面 是 4 个 可 选择 字段 、ModR/M、SIB、Displacement 和 Immediate, 
ModR/M 指定 寻 址 方式 ; SIB 指定 在 特定 寻 址 方式 下 的 倍数 (scale) 、 变 址 寄存 器 和 基 址 寄存 
ff; Displacement 指定 在 某 种 寻 址 方式 下 位 移 是 1 字 节 、2 字 节 还 是 4 字 节 ; Immediate 
是 指令 中 源 操作 数 使 用 的 1 字 节 、2 字 节 或 4 字 节 立即 数 。 男 外 ， 指 令 还 可 以 加 上 最 长 4 字 市 
长 度 的 可 选 前 级 来 修改 它 的 行为 。 


wit [ore Yanan [a0 [ncn | tam 


最 多 4 个 可 选 前 1、2 或 3 字 针对 特定 针对 特定 。 针对 特定 寻 址 ”针对 特定 寻 址 方 
级 ， 其 中 每 个 前 节 的 操作 码 = 寻 址 方式 的 。 寻 址 方式 的 方式 的 位 移 (1、 式 的 立即 数 (1、2 


缀 的 长 度 为 1 字 节 1 字 节 1 字 节 2 或 4 字 节 ) 或 4 字 节 ) 
2 位 3 位 3 位 2 位 3 位 3 位 


图 6-37 x86 指令 编码 


ModR/™M 使 用 2 位 Mod 字段 和 3 fii R/M 字段 来 确定 一 个 操作 数 的 寻 址 方式 。 操 作 数 可 以 来 
自 8 个 寄存 器 之 一 ， 或 者 来 自 24 个 存储 器 寻 址 方式 之 一 。 根 据 编 码 的 人 为 规定 ， 在 某 种 寻 址 
方式 中 ，ESP 和 EBP 寄存 髓 不 能 用 做 基地 址 或 变 址 寄存 占 。Reg 字段 指定 作为 另 一 个 操作 数 
的 寄存 器 。 对 于 不 需要 第 二 个 操作 数 的 指令 ，Reg 字段 为 操作 码 提 供 额 外 的 3 位 来 共同 形成 
opcode 宁 段 。 

在 使 用 变 址 寄存 器 的 寻 址 方式 中 ，SIB 字 节 用 于 确定 变 址 寄存 需 和 倍数 (1、2、4、8) 。 如 
果 使 用 基地 址 寄存 器 和 变 址 寄存 器 ， 则 STB 还 指定 基地 址 寄存 器 。 

MIPS 使 用 指令 的 opcode 和 funct 字段 来 确定 指令 。x86 使 用 可 变 的 位 数 来 确定 不 同 的 
指令 ， 它 使 用 较 少 的 位 来 判断 较 多 的 常见 指令 ,减少 了 指令 的 平均 长 度 。 有 些 指令 甚至 有 多 个 
EVENS. PUN, add AL，imm8 实现 将 一 个 8 位 立即 数 与 AL 相 加 ， 并 将 结果 存 人 AL 中 。 这 条 
指令 使 用 1 字 节 操作 码 (0x04) ， 后 面 是 1 字 节 立即 数 。 寄 存 器 A( AL. AX, EAX) PKA R i g 
(accumulator), — A M, add D, imm8 实现 将 一 个 8 位 立即 数 与 一 个 目的 操作 数 D( 内 存 或 者 
寄存 器 ) 相 加 ， 这 条 指令 使 用 1 字 节 操作 码 (0x80)， 后面 是 1 字 节 或 多 字 节 操作 数 D， 最 后 是 1 
字 节 立即 数 。 当 目的 操作 数 是 累加 颖 时 ， 可 以 缩短 许多 指令 的 编码 。 

在 最 初 的 8086 F, opcode 用 于 判断 指令 对 8 位 操作 数 还 是 16 位 操作 数 进行 操作 。 在 文 
持 32 位 操作 数 的 80386 出 现 后 ， 没 有 新 的 操作 码 字 段 用 于 判断 32 位 的 形式 ， 而 是 使 用 原来 的 
操作 码 字段 判断 16 位 或 32 位 操作 。 操 作 系 统 使 用 代码 段 描 述 符 (code segment descriptor ) 中 的 
一 位 附加 位 ， 指 定 处 理 器 应 该 选择 哪 种 格式 。 当 此 位 设 为 0 时 选择 8086 FER, opcode 默认 对 
16 位 操作 数 进 行 操作 ; 当 此 位 设 为 1 时 ， 程 序 默认 对 32 位 操作 。 另 外 ， 程 序 员 可 以 指定 前 绥 
来 改变 特定 指令 的 形式 。 如 果 prefix( 前缀 )0x66 出 现在 opcode 前 ， 则 使 用 男 一 个 大 小 的 操 
作 数 (在 32 位 模式 下 操作 数 为 16 位 ， 或 者 在 16 位 模式 下 操作 数 为 32 位 )。 


加 “如果 所 有 选择 域 都 使 用 ， 构 造 17 字 节 指令 是 可 能 的 。 然 而 ，x86 设置 了 15 字 节 的 合法 指令 限制 。 
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6.8.6 x86 的 其 他 特性 


80286 使 用 分 段 (segmentation) 方 式 将 内 存 划 分 为 多 段 ， 其 中 每 段 的 长 度 不 大 于 64KB。 当 
操作 系统 允许 分 段 时 ， 相 对 于 每 段 的 起 始 位 置 计 算 地 址 。 处 理 器 检查 是 否 超出 段 末尾 的 地 址 ， 
如 果 是 则 产生 一 个 错误 ， 从 而 保护 程序 不 会 超出 它们 自己 的 段 。 分 段 技术 引起 了 很 多 争议 ， 也 
没有 在 现代 Windows 操作 系统 的 各 个 版 本 中 使 用 。 

x86 包括 对 由 字 节 或 字 构 成 的 整个 字符 串 进 行 操作 的 字符 串 指 令 。 操 作 包 括 移动 、 比 较 或 
对 特定 值 的 扫描 。 在 现代 处 理 器 中 ， 这 些 指令 经 常 比 实 现 同等 操作 的 简单 指令 序列 慢 ， 所 以 应 
尽量 避免 使 用 这 些 指令 。 

如 前 所 述 ， 前 缀 0x66 用 于 选择 16 位 或 32 (PREM. AAA LIA: 锁定 总 线 (在 多 处 理 
器 系统 中 控制 访问 共享 变量 ); 预测 分 支 指令 是 否 执行 ; 在 字符 串 移动 时 重复 执行 指令 。 

任何 体系 结构 的 危害 都 是 将 内 存 容量 用 尽 。 由 于 x86 的 地 址 是 32 位 ， 所 以 X86 可 以 访问 
4GB 的 内 存 空间 。 这 比 1985 年 最 大 的 计算 机 容量 还 要 大 很 多 , 但 是 到 21 世纪 初 ， 这 些 容量 就 
很 有 限 了 。2003 年 ，AMD 将 地 址 空间 和 寄存 器 大 小 扩展 到 64 位 ， 称 为 增强 体系 结构 AMD64。 
AMD64 有 与 32 位 程序 兼容 的 模式 ， 当 操作 系统 采用 64 位 地 址 空间 时 ，32 位 程序 能 正常 运行 。 
2004 年 ，Intel 也 将 地 址 扩充 到 64 位 ， 并 重新 命名 为 “扩展 64 位 存储 咒 技 术 ” (Extended Mem- 
ory 64 Technology ，EM64T) 。 根 据 64 位 地 址 ， 计 算 机 可 以 访问 160EB 的 内 存 空间 。 

对 于 x86 体系 结构 中 更 加 奇特 的 细节 ， 可 以 参考 Intel 体系 结构 软件 开发 人 员 手 册 ( Intel 
Architecture Software Developer’ s Manual) ， 这 些 资料 可 以 从 Intel 网 站 上 免费 得 到 。 


6.8.7 -小 结 


本 节 讲 述 MIPS RISC 体系 结构 和 x86 CISC 体系 结构 的 区 别 。x86 倾向 于 更 短 的 程序 代码 ， 
因为 一 条 复杂 指令 的 功能 等 同 于 多 条 简单 的 MIPS 指令 序列 ， 而 且 因 为 指令 按照 占用 内 存 空间 
较 少 的 方式 编码 。 然 而 ，X86 体系 结构 是 一 个 将 多 年 技术 聚集 在 一 起 的 大 杂烩 ， 其 中 有 些 指令 
已 经 不 再 使 用 ， 但 是 为 了 保证 兼容 以 前 的 程序 ， 这 些 指令 必须 保留 。x86 中 的 寄存 器 很 少 ， 并 
且 指 令 很 难 译 码 ， 解 释 它 的 指令 集 就 很 困难 。 尽 管 有 以 上 这 些 缺 点 ， 但 x86 也 不 会 轻易 改变 其 
主流 PC 计算 机 体系 结构 的 地 位 ， 因 为 软件 兼容 性 的 价值 太 大 以 及 巨大 的 市 场 保护 设计 更 快 
x86 微 处 理 需 的 努力 。 


6.9 总 结 


要 指挥 计算 机 ， 必 须 说 计算 机 的 语言 。 计 算 机 体系 结构 定义 如 何 指 挥 处 理 器 。 当 前 有 许多 
不 同 的 计算 机 体系 结构 已 经 得 到 广泛 应 用 ,但 是 一 旦 你 了 解 了 其 中 一 种 ， 学 习 其 他 体系 结构 就 
非常 容易 。 在 接触 一 种 新 体系 结构 时 ， 需 要 提出 以 下 关键 问题 : 

© 数据 字 长 是 多 少 ? 

。 寄存 器 是 什么 ? 

© 内 存 是 怎样 组 织 的 ? 

e 指令 是 什么 ? 

MIPS 是 一 种 32 位 体系 结构 ， 因 为 它 对 32 位 数据 进行 操作 。MIPS 体系 结构 有 32 个 通用 寄 
存 器 。 原 则 上 ， 几 乎 所 有 的 寄存 器 可 以 用 于 任何 目的 。 然 而 ， 习 惯 上 ， 特 定 的 寄存 器 用 于 特定 
的 目的 ， 这 样 会 使 编程 更 容易 ， 而 且 由 不 同 程序 员 写 的 函数 可 以 更 容易 地 相互 通信 。 例 如 ， 寄 
存 器 0( $0) 总 是 保存 常数 0，$ra 保存 jal 指令 后 的 返回 地 址 ，$a0 ~ $a3 和 $v0 ~ $v1 分 
别 保存 函数 的 参数 和 返回 值 。MIPS 有 一 个 32 位 地 址 的 字 节 寻 址 内 存 系统 。6. 6. 1 节 说 明了 内 
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存 映射 。 指 令 长 度 为 32 位 ， 而 且 必 须 字 对 齐 。 本 章 讨 论 了 最 常见 的 MIPS 指令 。 

定义 一 种 计算 机 体系 结构 的 威力 在 于 针对 特定 体系 结构 写 出 的 程序 可 以 运行 在 这 种 体系 结 
构 的 不 同 实现 上 。 例如 ， 为 1993 年 的 Intel Pentium 处 理 器 所 写 的 程序 一 般 仍 然 可 以 在 2012 年 
的 Intel Xeon 处 理 器 或 者 AMD Phenom 处 理 器 上 运行 (而 且 运 行 得 更 快 ) 。 

在 本 书 的 第 一 部 分 ， 我们 理解 了 电路 和 抽象 的 逻辑 层 。 在 本 章 , 我 们 跳 到 了 体系 结构 层 ， 
在 下 一 章 ， 我 们 将 学 习 微 体系 结构 ， 通 过 组 合 对 数字 电路 模块 实现 处 理 器 体系 结构 。 微 体系 结 
构 是 硬件 和 软件 工程 之 间 的 链 路 。 而 且 ， 我 们 相信 这 是 所 有 工程 中 最 让 人 兴奋 的 主题 之 一 : 你 
将 学 习 建 立 你 自己 的 微 处 理 器 ! 


>) eA 

6.1 给 出 3 个 依照 如 下 原则 设计 MIPS 体系 结构 的 例子 : (1) 简单 设计 有 助 于 规整 化 ; (2) 加 
快 常见 功能 ; (3) 越 小 的 设计 越 快 ; (4) 好 的 设计 需要 好 的 折 中 方法 。 解 释 这 些 例子 如 
何 体现 这 些 特 征 。 

6.2 MIPS 体系 结构 中 有 一 个 包含 32 个 32 位 寄存 器 的 寄存 器 集 。 设 计 一 个 不 包含 寄存 器 集 的 
计算 机 体系 结构 是 否 可 能 ?如 果 可 能 ， 简单 描述 此 体系 结构 以 及 它 的 指令 集 。 这 种 体系 
结构 与 MIPS 相 比 ， 其 优 缺 点 各 是 什么 ? 

6. 3 考虑 一 个 使 用 字 节 和 寻 址 存储 响 的 存储 器 ， 一 个 32 位 字 存 储 在 此 存储 器 的 第 42 个 字 的 位 置 。 
(a) 第 42 个 字 的 字 节 地 址 是 什么 ? 

(b) 第 42 个 字 在 内 存 中 的 地 址 范围 是 什么 ? 
(c) OxFF223344 按照 大 端 或 小 端 形式 将 存储 在 第 42 个 字 中 ,， 画 出 如 图 6-4 所 示 的 示意 
图 。 清 楚 标 出 与 每 个 数据 字 节 值 对 应 的 字 节 地 址 。 

6.4 重复 习题 6.3， 考 虑 一 个 使 用 字 节 寻 址 存储 器 的 存储 器 ， 一 个 32 位 字 存 储 在 此 存储 器 的 
第 15 个 字 的 位 置 。 

6.5 解释 下 述 代码 如 何 判断 计算 机 采用 大 端 还 是 小 端 ; 

li $t0, OxABCD9876 
sw $tO, 100($0) 
1b $s5, 101($0) 
6.6 JH ASCII 编码 描述 写 出 下 述 字 符 串 ， 用 十 六 进 制 写 出 结果 。 
(a) SOS 
(b) Cool! 
(c)〈 你 自己 的 名 字 ) 
6.7 针对 下 列 字 符 串 重复 习题 6.6。 
(a) howdy 
(b) lions 
(c) To be rescue! 
6.8 说 明 习题 6.6 中 的 字符 串 怎 样 使 用 大 端 形式 和 小 端 形 式 存 储 在 字 节 寻 址 存储 器 中 ， 其 起 始 
地 址 为 0x1000100C。 使 用 类 似 图 6-4 中 的 图 ， 清 楚 地 表示 每 种 形式 下 每 个 字 节 的 内 存 地 址 。 
9 针对 习题 6.7 中 的 字符 串 重复 习题 6. 8。 
6.10 将 下 述 MIPS 汇编 代码 转换 为 机 器 代码 ， 并 用 十 六 进 制 写 出 指令 


add $t0, $s0, $sl 
lw StU- Ox20($t7) 
addi $s0, $0, ~10 


6. 11 将 下 面 代码 转换 为 机 器 代码 ， 要 求 同 习题 6. 10. 
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addi $sQ, $0, 73 
sw $tl, -—7($t2) 
sub Stl, $s7, $S2 


考虑 工 类 型 指令 -。 

(a) 习题 6. 10 中 的 哪些 指令 是 I 类 型 指令 ? 

(b) 符号 扩展 (a) 中 每 条 指令 的 16 位 立即 数 ， 使 它 成 为 32 位 数据 。 

针对 习题 6. 11 中 的 指令 重复 习题 6. 12. 

将 下 列 机 器 代码 转换 为 MIPS 汇编 代码 。 左 边 的 数字 是 内 存 中 的 指令 地 址 ， 右 边 的 数字 
给 出 此 地 址 的 指令 然后 将 这 些 汇编 指令 反 编 译 为 高 级 语言 程序 ， 并 解释 这 段 代 码 实现 
了 什么 功能 ， 其 中 $a0 是 输入 ， 其 初始 值 包括 一 个 正 数 n，S$v0 是 输出 。 


0x00400000 
0x00400004 
0x00400008 
0x0040000C 
0x00400010 
0x00400014 
0x00400018 
0x0040001C 
0x00400020 


针对 下 列 机 器 代码 重复 习题 6. 14。 其 中 ， 
F, $al 存储 一 个 含有 32 个 元 素 的 字符 数组 (char ) 。 


0x00400000 
0x00400004 
0x00400008 
0x0040000C 
0x00400010 
0x00400014 
0x00400018 
0x0040001C 
0x00400020 


0x20080000 
0x20090001 
0x0089502A 
0x15400003 
0x01094020 
0x21290002 
0x08100002 
0x01001020 
0x03E00008 


Ox2008001F 
0x01044806 
0x31290001 
0x0009482A 
0xA0A90000 
0x20A50001 
Ox2108F FFF 
Ox0501FFF9 
0x03E00008 


$a0 和 Sal 是 输入 ， 


Sad 存储 一 个 32 位 数 
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nori 指令 不 在 MIPS 指令 集中 ， 因 为 使 用 MIPS 指令 集中 已 有 的 指令 可 以 完成 相同 的 功 
能 。 写 一 个 短 的 汇编 代码 片段 来 实现 下 述 功 能 : St0 = $t1 NOR 0xF234。 使 用 的 指 
令 越 少 越 好 。 

使 用 sit 指令 完成 下 面 的 高 级 语言 代码 段 。 假 定 整 型 变量 gM h 分 别 存 储 在 寄存 器 
$s0 和 $sl 中 。 


(a) if (g>h) 
g=9+h; 
else 
g=g-h; 


(b) if (g>=h) 


(c) if (g <=h) 
g=0; 
else 
h=0; 


使 用 高 级 语言 写 函 数 int find42 (int array[], int size), HF size 声明 数组 
元 素 的 个 数 ，array 声明 数组 的 基地 址 。 此 函数 返回 数组 中 保存 数值 和 2 的 第 一 个 指 
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6. 19 


6. 20 
6. 21 


6. 22 


6. 23 


第 6 ¥ 


针 ， 如 果 数 组 中 没有 42 这 个 数 ， 那 么 返回 -1。 
高 级 语言 函数 strcpy 将 字符 串 sre 复制 到 字符 串 dst 中 。 


// C code 
void strcpy(char dst[], char src[]) 4 
int 1 =0; 


do { 
OSELi] SPELT. 
} while (src[i++]); 
} 
(a) 将 strcpy 函数 用 MIPS 汇编 代码 实现 ， 使 用 $s0 存储 io 
(b) 画图 描述 在 调用 strcpy 之 前 、 之 中 、 之 后 栈 的 变化 ， 假 设 在 调用 strcpy 前 $sp = 
0x7FFFFFO00。 
将 习题 6. 18 中 的 高 级 语言 代码 转换 为 MIPS 汇编 代码 。 
考虑 下 面 的 MIPS 汇编 代码 ， 其 中 funcl, func2 和 func3 是 非 叶子 男 数 ，func4 是 
叶子 函数 。 每 个 函数 的 代码 没有 完全 描述 出 来 ， 但 注释 说 明了 每 个 函数 使 用 哪些 寄 
FEAR o 


0x00401000 funcl:... # funcl uses $s0-$s1 
0x00401020 jal func2 

0x00401100 func2: i.. # func2 uses $s2-$s7 
0x0040117C jal func3 

0x00401400 func3: ... # func3 uses $s1-$s3 
0x00401704 jal func4 

0x00403008 func4: ... # func4 uses no preserved 
0x00403118 jr $ra # registers 


(a) 每 个 函数 的 栈 帧 有 多 少 个 字 ? 

(b) 画 出 调用 func4 之 后 栈 的 情况 ， 说 明 寄 存 需 在 栈 中 的 具体 位 置 ， 如 果 可 能 给 出 寄 
FF tit AJE o 

LRA RBI PETERS BEM TRAE ZA, K 6-16 列 出 了 数列 中 的 前 几 个 数 fib(n)。 


表 6-16 ERARAJ 





(a) 当 n=0 和 n= -1 时 fib(n) 是 多 少 ? 

(b) 使 用 高 级 语言 写 一 个 名 字 为 fib 的 图 数 ， 对 于 任意 非 负 值 zm， 返 回 斐 波 纳 契 数列 中 
的 第 nn 个 值 。 提 示 : 可 能 需要 使 用 循环 。 给 你 的 代码 添加 注释 。 

(c) 将 (b) 中 的 高 级 语言 代码 转换 为 MIPS 汇编 代码 。 在 每 一 行 代 码 的 后 面 添 加 注释 来 
描述 代码 完成 什么 功能 。 使 用 SPIM 模拟 器 测试 你 的 代码 运行 fib(9) 是 否 正 确 ( 参 
考 前 言 查 看 如 何 安 装 SPIM 模拟 器 ) 。 

思考 代码 示例 6. 27 的 C 语言 代码 ,假设 当 输 入 n =5 时 调用 factorial PAR. 

(a) 当 factorial 函数 返回 到 调用 函数 时 ， $v0 中 的 值 是 多 少 ? 

(b) 假设 你 删除 了 地 址 0x98 和 0xBC 中 的 指令 ， 这 些 指令 用 于 保存 和 恢复 $ra 中 的 值 。 
这 个 程序 会 (1) 陷入 无 限 循环 ， 但 不 造成 月 泪 ; (2) 毅 溃 (导致 栈 溢出 动态 数据 段 
或 者 PC 跳 转 到 程序 外 的 位 置 ); (3) 当 程 序 返 回 到 循环 时 产生 一 个 不 正确 的 返回 
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值 (如 果 是 这 样 ， 那 么 这 个 值 是 多 少 ?) ; (4) 不 受 被 删除 指令 的 影响 ， 正 常 运行 ? 


(c) 针对 以 下 被 删除 指令 对 应 的 地 址 ， 


重复 (b): 


( 1 ) 0x94 和 0xC0( 保 存 和 恢复 Sad 的 指令 )。 
(ii ) 0x90 和 0xC4( 保 存 和 恢复 $sp 的 指令 )。 注 意 : 没有 删除 factorial 标记 。 


(iii) 0xAC( 恢 复 $sp WHS). 


6.24 Ben 试 着 计算 函数 f(a, b) =2a +35， 其 中 bb 为 非 负 数 。 他 使 用 函数 调用 和 递归 来 实现 ， 
并 用 以 下 高 级 语言 代码 实现 函数 和 f2 。。 


// high-level code for functions f and f2 


int f(int a, int b) { 
int j; 

j=4; 

return j +a+f2(b); 
} 


int f2(int x) 

{ 

int ki 

K = 3s 

if (x== 0) return 0: 
else return k + f2(x—1); 
} 


然后 Ben 将 这 两 个 函数 转换 为 如 下 所 示 的 汇编 代码 。 他 还 写 了 一 个 测试 函数 test 来 调 


用 函数 E(5，3)。 
# MIPS assembly code 


Ff: $a0=a, $al=b, $s0 = j; f2:.$a0=x, $s0 =k 


0x00400000 test: addi $a0, $0, 5 


0x00400004 addi $al, $0, 3 
0x00400008 jal f 

Ox0040000C loop: j loop 
0x00400010 f: addi $sp, $sp, —16 
0x00400014 sw $al, 12($sp) 
0x00400018 sw $a0, 8($sp) 
0x0040001C sw $ra, 4($sp) 
0x00400020 sw $s0, 0($sp) 
0x00400024 add $s0, $a0, $0 
0x00400028 add $a0, $al, $0 
0x0040002C jal f2 
0x00400030 Iw $a0, 8($sp) 
0x00400034 lw $al, 12($sp) 
0x00400038 add $v0, $v0, $s0 
0x0040003C add $v0, $v0, $a0 
0x00400040 Iw $s0, 0($sp) 
0x00400044 lw $ra, 4($sp) 
0x00400048 addi $sp, $sp, 16 
0x0040004C jr $ra 
0x00400050 f2: addi $sp, $sp, 一 2 
0x00400054 sw $a0, 8($sp) 
0x00400058 sw $ra, 4($sp) 
0x0040005C sw $s0, 0($sp) 
0x00400060 addi $s0, $0, 3 
0x00400064 bne $a0, $0, else 
0x00400068 addi $v0, $0, 0 
0x0040006C j done 


# $a0=5 (a=5) 

# $al=3 (b=3) 

# call (5, 3) 

# and loop forever 


# make room on the stack 

# for $s0, $a0, $al, and $ra 
# save $al (b) 

# save $a0 (a) 

# save $ra 

# save $s0 

# $s0 = $a0 (j =a) 

# place b as argument for f2 
# call f2(b) 

# restore $a0 (a) after cal] 
# restore $al (b) after call 
# $v0 = f2(b) + j 
#$v0=(f2(b)+j)+a 

# restore $s0 

# restore $ra 

# restore $sp (stack pointer) 
# return to point of call 


# make room on the stack for 
#$s0, $a0, and $ra 

# save $a0 (x) 

# save return address 

# save $s0 

#k=3 

#x=0? 

# yes: return value should be 0 
# and clean up 
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6. 26 


0x00400070 else: addi $a0, 


0x00400074 
0x00400078 
0x0040007C 
0x00400080 
0x00400084 
0x00400088 
0x0040008C 


done: 


Tat FE 

lw $a0, 
add $v0, 
lw $s0, 
lw $ra, 
addi $sp, 
jr $ra 


$a0, -1 


8($sp) 
$v0, $s0 
O($sp) 
4($sp) 
$sp, 12 


pO F 


# no: $a0=$a0-1 (x=x-1) 
0811. TAK)) 


# 
# 
i 
# 
# 
j 


restore $a0 (x) 

$v0 = f2(x- 1) +k 
restore $s0 

restore $ra 

restore $sp 

return to point of call 


画 出 与 图 6-26 类 似 的 栈 空间 图 有 助 于 回答 如 下 问题 。 
(a) 如 果 代 码 由 test 程序 开始 ， 运 行 到 loop 时 $v0 的 值 是 多 少 ? 该 程序 能 正确 计算 


2a +36 E? 


(b) 假设 Ben 删除 地 址 0x0040001C 和 0x00400040 中 用 来 保存 和 恢复 Sra 的 指令 。 程 序 
将 出 现 以 下 哪 一 种 情况 ? (1) 进入 无 限 循环 但 是 没有 崩 演 ; (2) 月 演 ( 导 致 栈 超出 
动态 数据 段 或 者 PC 跳 转 到 程序 外 面 ); (3) 当 程 序 返 回 到 循环 时 在 $v0 中 产生 一 


个 错误 值 ( 如 果 是 这 样 ， 值 是 什么 ?) ; (4) 尽管 删除 了 一 行 ， 
当 删 除 下 列 地 址 存储 的 指令 时 ， 重 复 (b) 中 的 问题 : 


(c 


i 


但 程序 仍 能 运行 。 


( i ) 0x00400018 和 0x00400030( 保存 和 恢复 Sao 的 指令 ) 
( ii ) 0x00400014 和 0x00400034( 保存 和 恢复 Sal 的 指令 ) 
( iii ) 0x00400020 和 0x00400040( 保存 和 恢复 $s0 的 指令 ) 
(iv ) 0x00400050 和 0x00400088 (保存 和 恢复 Ssp 的 指令 ) 
( v ) 0x0040005C 和 0x00400080( 保存 和 恢复 ss0 的 指令 ) 
( vi ) 0x00400058 和 0x00400084 ( 保存 和 恢复 Sra 的 指令 ) 
( vii) 0x00400054 和 0x00400078 ( 保存 和 恢复 $a0 的 指令 ) 
将 以 下 beg 指令 、j 指令 和 jal 指令 的 汇编 指令 代码 转换 为 机 器 码 。 每 条 指令 的 指令 


地 址 在 左边 给 出 。 


(a) 0x00401000 
0x00401004 
0x00401008 
0x0040100C 


(b) 0x00401000 


0x00402040 
(c) 0x0040310C 


0x00405000 
(d) 0x00403000 


0x0041147C 
(e) 0x00403004 


0x0040400C 


beq $t0, $sl, Loop 


Loop: 
beq $t7, $s4, done 
done: 
back: 
beq $t9, $57, back 
jal func 
func: 
back: 
j back 


考虑 下 述 MIPS 汇编 语言 片段 。 左 边 的 数字 是 每 条 指令 的 地 址 。 


0x00400028 
0x0040002C 
0x00400030 f1: 
0x00400034 f2: 
0x00400038 
0x0040003C 


0x00400040 else: 


0x00400044 


$a0, $al, $0 


sw $s0, 0( $582) 


j fl 
addi 
j f2 


$a0, $0, else 


$a0, $a0, -1 
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(a) 将 以 上 的 代码 序列 转换 为 机 器 代码 ， 并 用 十 六 进 制 写 出 机 器 代码 指令 。 
(b) 在 每 一 行 代码 之 后 列 出 其 寻 址 方式 。 
考虑 下 述 C 语言 代码 片段 。 
// C code 
void setArray(int num) 1 

THE i: 

int array[10]; 

tor Ci 0r t< 10: T's 7-4 1) A 

array[i] =compare(num, i); 


| 
| 


int compare(int a, int b) i 
if (sub(a, b) >=0) 
return 1; 
else 
return 0; 
} 


int sub(int a, int b) { 
return a- b; 

} 

(a) 使 用 MIPS 汇编 语言 改写 该 C 代码 片段 。 使 用 $s0 保存 变量 i。 确 保 正确 使 用 栈 指 
针 。 数 组 存储 在 栈 中 ， 此 栈 由 setArray 图 数 创 建 ( 见 6.4.6 节 )。 

(b) 假定 setArray 图 数 是 第 一 个 被 调用 的 函数 。 画 出 调用 setArray 之 前 和 每 个 函 
数 调用 时 栈 的 情况 ， 指 出 存储 在 栈 中 的 寄存 器 和 变量 的 名 字 ， 记 录 $sp 的 位 置 ， 
并 清晰 标记 每 个 栈 帧 。 

(c) 如果 Sra 没有 保存 在 栈 中 ， 代 码 会 完成 什么 功能 ? 


Sire PIRSA A AAL: 
// C code 
intfiet n, Tt kt 
int p: 
b=k+2; 


if (n == 0) b = 10; 
elseb=b+(n*n)+f(n-1, k4+1); 
return b* k; 

} 


(a) PX ECR RIA AARAA MIPS 汇编 代码 。 特 别 注意 在 函数 调用 中 保存 和 恢复 寄 
存 器 以 及 使 用 MIPS 保护 寄存 器 的 惯例 。 为 你 的 代码 写 注释 。 可 以 使 用 MIPS 的 
mult 指令 。 程 序 开 始 于 指令 地 址 0x00400100。 局 部 变量 b 保存 在 $s0 中 。 

(b) 手动 一 步 步 地 执行 (a) 中 的 程序 来 计算 E(2，4) 。 画 出 与 图 6-26c 类 似 的 栈 空间 图 ， 
写 出 栈 中 每 个 位 置 保存 的 寄存 器 名 和 变量 值 并 给 出 栈 指 针 ( Ssp) 的 变化 过 程 。 明 确 
标记 每 个 栈 帧 。 在 执行 过 程 中 ， 你 将 发 现 跟踪 Sad, Sal. $v0 和 $s0 中 的 值 很 有 
FA. (Boe VFA £ AY, $s0 =OxABCD, $ra =0x400004。 $v0 的 最 后 值 是 多 少 ? 

MIPS 中 beg 和 bne 等 条 件 分 支 指 令 的 跳 转 地 址 范围 是 多 少 ? 答案 用 与 条 件 分 支 指令 相 

关 的 指令 数 表 示 。 

下 述 问题 考察 跳 转 指令 j 的 局 限 性 。 用 与 跳 转 指令 相关 的 指令 数 表示 。 

(a) 在 最 坏 的 情况 下 ，j 指令 可 以 向 前 跳 多 远 ( 跳 向 更 高 的 地 址 )? (最 坏 的 情况 是 指 跳 
转 指 令 不 能 向 前 跳 转 的 情况 ) ， 使 用 语言 和 例子 分 别 解释 。 
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6. 33 


6. 34 


6. 36 


6. 37 
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(b) 在 最 好 的 情况 下 ，j 指令 可 以 向 前 跳 多 远 ( 最 好 的 情况 是 指 跳 转 指令 可 以 跳 转 最 
w)? 并 解释 。 

(c) 在 最 坏 的 情况 下 ，j 指令 可 以 加 后 跳 多 远 ( 跳 往 更 低 的 地 址 )? 并 解释 。 

(d) 在 最 好 的 情况 下 ，j RCA Wwe we? 并 解释 。 

解释 为 什么 跳 转 指令 j 和 jal 中 有 一 个 大 的 地 址 空间 字段 addr. 

使 用 汇编 代码 写 一 段 程 序 ， 从 第 一 条 指令 跳 转 到 第 64M 条 指令 ， 其 中 1M 指令 =2” = 

1048 576 条 指令 。 假 定 代 码 开始 于 0x00400000 地 址 ， 使 用 的 指令 条 数 越 少 越 好 。 

使 用 高 级 语言 写 一段 程 序 ， 将 一 个 存储 在 小 端 形式 下 的 10 个 32 位 整 型 数组 转化 成 大 端 

形式 。 写 完 高 级 语言 代码 后 ， 将 它 转 换 为 MIPS 汇编 代码 ， 给 你 的 代码 加 上 注释 ， 使 用 

的 指令 条 数 越 少 越 好 。 

考虑 两 个 字符 串 : stringl 和 string2。 

(a) 使 用 高 级 语言 写 一 个 函数 concat ， 将 两 个 字符 串 连 接 起 来 : void concat ( char 
[] stringl, char[] string2, char[] stringconcat)。 程序 不 需要 返回 值 ， 
它 将 stringl 和 string2 连接 起 来 取代 stringconcat 的 值 。 假 定 
stringconcat 足够 长 可 以 容纳 连接 起 来 的 字符 串 。 

(b) 将 (Ca) 中 的 代码 转换 为 MIPS 汇编 代码 。 

写 一 个 MIPS 汇编 代码 将 存储 在 $s0 和 $sl 中 的 两 个 单 精度 浮 点 相 加 。 不 要 使 用 任何 

MIPS 浮 点 指令 ， 不必 考虑 特殊 值 (例如 ，0、NANs、INF) 或 者 产生 上 洲 或 下 洲 的 情况 。 

使 用 SPIM 模拟 右 测 试 代码 ， 证 明代 码 功 能 可 靠 。 

说 明 下 面 的 MIPS 代码 如 何 装 入 内 存 并 执行 。 


# MIPS assembly code 
main: 
addi $sp, $sp, —4 
Sw $ra, O($sp) 
lw $a0, x 
lw $al, y 
jal diff 


lw $ra, O($sp) 
addi $sp, $sp, 4 
jr $ra 

diff: 
sub $v0, $a0, $al 
jr $ra 


(a) 首先 说 明 每 条 汇编 指令 的 指令 地 址 。 

(b) 用 符号 表 来 说 明 符号 的 标志 和 它们 的 地 址 。 
(c) 将 所 有 的 指令 转换 为 机 器 代码 。 

(d) 数据 段 和 地 址 段 分 别 有 多 少 字 节 ? 

(e) 画 出 内 存 映射 来 描述 数据 和 指令 存储 在 哪里 ? 
针对 以 下 MIPS 代码 ,重复 习题 6. 36. 


# MIPS assembly code 
main: 
addi $sp, $sp, 一 4 
Sw $ra, O($sp) 
addi $t0, $0, 15 
Sw $t0, a 
addi $al, $0, 27 
sw $al, D 
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6. 38 


6. 39 


lw $a0, a 
jal greater 
lw $ra, O($sp) 
addi $sp, $sp, 4 
jr $ra 

greater: 
slt $v0, $al, $a0 
jr $ra 


用 MIPS 指令 来 实现 下 述 伪 指 令 。 可 以 使 用 汇编 句 寄 存 器 Sat, (AAA ARH ( ae) 
HAE AITA o 

(a) addi--$t0, -S2 imm,,,, 

(b) lw $t5, imn,,., ($s0) 

(c) rol $t0, Stl，5( 将 Stl ABS 位 ， 然 后 将 结果 放 人 Sto 中 ) 
(d) ror $s4, $t6, 31( 将 St6 右 移 31 位 ， 然 后 将 结果 放 和 人 $s4 中 ) 
针对 以 下 伪 指 令 ， 重 复习 题 6. 38。 

(a) beq $ti, = immy sg, D 

(bh) ble St3, =r St je <i 

(el bate Sta, St at 

(d) boge 83, n tH 


面试 问题 
下 述 问题 在 数字 设计 工作 的 面试 中 曾经 被 问 到 (但 对 于 其 他 汇编 语言 也 适用 ) 。 


6.1 


6.2 


6. 3 


6. 4 
6. 5 
6.6 
6. 7 


写 一 段 MIPS 汇编 代码 ， 交 换 两 个 寄存 器 Sto 和 Stl 中 的 内 容 ， 但 不 允许 使 用 其 他 寄 
存 器 。 

假设 给 定 一 个 存 有 正 数 和 负数 的 整 型 数组 。 写 一 段 MIPS 汇编 代码 寻找 具有 最 大 和 的 数 
组 子 集 假定 数组 的 基地 址 存储 在 $a0 中 ,数组 长 度 存 储 在 Sal 中 , 产生 的 数组 的 子 集 的 
起 始 地 址 存储 在 $a2 中 。 编 写 代 码 ， 使 之 运行 得 越 快 越 好 。 

数组 中 保存 着 一 个 C 语言 字符 串 。 设 计算 法 来 反 转 字符 串 并 将 新 字 串 存储 在 原来 的 数组 
中 。 使 用 MIPS 汇编 代码 完成 该 算法 。 

设计 算法 来 计算 一 个 32 位 数字 中 “1 的 个 数 ， 使 用 MIPS 汇编 代码 完成 。 

编写 MIPS 汇编 代码 ， 反 转 寄存 器 中 的 位 。 使 用 的 指令 越 少 越 好 ， 假 设 寄存 器 是 St3 。 
编写 MIPS 汇编 代码 ， 测 试 $St2 和 $t3 相 加 时 是 否 有 溢出 ,使 用 的 指令 越 少 越 好 。 

设计 算法 ， 测 试 给 定 的 字 串 符 是 否 为 回 文 ( 回 文 就 是 从 前 面 读 和 从 后 面 读 是 一 样 的 ， 例 
如 ，wow 和 racecar 就 是 回 文 ) 。 使 用 MIPS 汇编 代码 完成 算法 。 
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本 章 参考 Matthew Watkins 的 页 献 。 

在 本 章 中 ， 我 们 不 仅 将 学 习 如 何 构 成 一 个 MIPS 微 处 理 器 ， 而 且 应用 软件 
还 将 仔细 讨论 3 种 不 同 的 实现 方案 。 这 3 种 方案 在 性 能 、 成 本 和 复杂 
性 上 具有 不 同 的 折 中 。 

对 于 外 行 来 说 ， 设 计 一 个 微 处 理 需 就 像 魔术 一 样 难以 琢磨 。 但 是 
实际 上 它 是 相对 直观 的 ， 而 且 通 过 前 面 的 课程 已 经 具备 了 所 需 的 基本 
知识 。 尤 其 是 ， 前 面 的 课程 中 已 经 介绍 了 设计 组 合 逻 辑 和 时 序 逻 辑 来 
实现 给 定 的 功能 和 时 序 规范 。 你 也 熟悉 了 算术 单元 电路 和 存储 器 电路 ， 
而 且 已 经 掌握 MIPS 体系 结构 ， 了 解 了 从 MIPS 处 理 器 程序 员 角 度 所 见 
的 寄存 器 、 指 令 和 存储 器 等 概念 。 

本 章 将 主要 介绍 用 于 连接 逻辑 和 体系 结构 的 微 体 系 结构 ( microar- 
chitecture) 。 微 体系 结构 是 将 寄存 器 、ALU、 有 限 状 态 机 、 存 储 禹 和 其 
他 逻辑 模块 等 组 合 在 一 起 ， 实 现 一 种 体系 结构 。 一 个 特定 的 体系 结构 
(例如 ，MIPS) 可 以 有 不 同 的 微 体 系 结构 ， 每 个 具有 性 能 、 成 本 和 复杂 
性 的 不 同 折 中 。 它 们 可 以 运行 相同 的 程序 ， 但 是 内 部 设计 却 差异 很 大 。 
本 章 中 将 设计 3 种 不 同 的 微 体系 结构 来 说 明 这 些 折 中 的 差异 。 

本 章 的 内 容 大 部 分 基于 David Patterson 和 John Hennessy 所 著 《 Com- 
puter Organization and Design》 中 的 经 典 MIPS 设计 。 他 们 慷慨 地 分 享 了 精 马 的 设计 ， 这 些 设计 相 
对 简单 ， 而 且 可 以 易于 理解 真实 的 商业 体系 结构 。 


7.1.1 体系 结构 状态 和 指令 集 


正如 前 面 所 讨论 ， 计 算 机 体系 结构 包括 指令 集 和 体系 结构 状态 (architecture state), MIPS 
处 理 器 的 体系 结构 状态 包括 程序 计数 器 和 32 个 寄存 器 。 任 何 一 个 MIPS 微 体 系 结构 都 必须 包含 
所 有 这 些 状 态 。 基 于 当前 体系 结构 状态 ， 处 理 器 执行 一 条 具有 特定 数据 集 的 特定 指令 ， 将 产生 
一 个 新 的 体系 结构 状态 。 有 些微 体系 结构 包含 附加 的 非 体 系 结构 状态 (nonarchitecture state ) 以 
简化 逻辑 或 提升 性 能 。 我 们 将 在 遇 到 它们 时 再 讨论 它们 。 

为 了 使 得 微 体系 结构 易于 理解 ， 我 们 仅 考 虑 MIPS 指令 系统 的 一 个 子 集 ， 具 体 地 ， 我 们 主 
要 考虑 : 

e R 类 型 算术 /逻辑 指令 : add, sub, and, or 和 slt。 

© 存储 器 指令 : lw. swo 

e 分 支 指令 : beqo 

在 构造 了 处 理 这 些 指令 的 微 体系 结构 后 ， 我 们 将 扩展 它们 以 便 处 理 addi A j 指令 。 之 所 
以 选择 这 些 特殊 的 指令 ， 是 因为 通过 它们 可 以 构造 一 些 有 趣 的 程序 。 一 旦 理解 了 如 何 实现 这 些 
指令 ， 就 可 以 进一步 扩展 硬件 以 便 实现 其 他 指令 。 
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7.1.2 设计 过 程 

可 以 将 微 体 系 结构 分 为 两 个 相互 作用 的 部 分 : 数据 路 径 (datapath ) 和 控制 (control) 。 数 据 
路 径 对 数据 字 进 行 操作 。 它 包含 存储 器 、 寄 存 器 、ALU 和 复 用 器 等 结构 。MIPS 是 一 个 32 位 体 
系 结 构 ， 因 此 我 们 使 用 32 位 数据 路 径 。 控 制 单 元 从 数据 路 径 接 收 当前 指令 ， 并 控制 数据 路 径 
如 何 执行 这 条 指令 。 具 体 地 ， 控 制 单元 产生 复 用 器 选择 、 寄 存 器 使 能 和 存储 器 写 信号 来 控制 数 
据 路 径 的 操作 。 

设计 复杂 系统 时 ， 一 种 好 方法 是 从 包含 状态 元 件 的 硬件 开始 。 这 些 元 件 包括 存储 器 和 体系 
结构 状态 (程序 计数 器 和 寄存 器 ) 。 然 后 ， 在 这 些 存储 组 件 之 间 增 加 组 合 逻 辑 基 于 当前 状态 计 
算 新 的 状态 。 从 部 分 存储 器 中 读 指 令 ， 然 后 装 人 和 存储 指令 从 另 一 部 分 存储 堪 读 或 写 数 据 。 因 
此 ， 很 方便 将 一 个 存储 器 分 为 两 个 小 的 存储 器 ， 一 部 分 包含 指令 ， 另 一 部 分 包含 数据 。 图 7-1 
中 给 出 了 具有 4 个 状态 元 件 (程序 计数 器 、 寄 存 器 文件 、 指 令 存 储 器 和 数据 存储 颖 ) 的 框图 。 
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图 7-1 MIPS 处 理 器 的 状态 元 件 


在 图 7-1 中 ， 粗 线 表示 32 位 数据 总 线 ， 中 等 粗细 的 线 表 示 较 窄 的 总 线 ( 例 如 ， 寄 存 器 文件 
EADS 位 地 址 总 线 ) 。 灰 色 细 线 表 示 控 制 信号 ， 例 如 寄存 器 文件 写 使 能 。 我 们 在 本 章 中 使 用 这 
些 惯例 来 避免 数据 总 线 宽度 显得 杂乱 无 章 。 而 且 ， 状 态 元 件 通常 有 一 个 复位 输入 将 它们 放 人 局 
动 时 的 已 知 状 态 。 为 了 避免 电路 图 杂乱 ， 这 些 复位 输入 就 不 再 画 出 。 

程序 计数 器 (program counter) 是 一 个 普通 的 32 位 寄存 器 。 它 的 输出 PC 指向 当前 指令 ， 它 
的 输入 PC' 表 示 下 一 条 指令 的 地 址 。 

指令 存储 器 (instruction memory ) 有 一 个 读 端 口 ?， 它 包括 32 位 指令 地 址 输入 4， 它 从 这 个 
地 址 读 32 位 数据 (指令 ) 并 传送 到 读数 据 输出 RD Eo 

32 个 单元 x32 位 寄存 器 文件 有 两 个 读 端 口 和 一 个 写 端 口 。 读 端口 具有 5 位 地 址 输入 Al 和 
A2， 每 个 用 于 指定 2 =32 个 寄存 器 中 的 一 个 作为 源 操作 数 。 它 们 可 以 读 32 位 寄存 器 的 值 并 分 
别传 送 到 RD1 和 RD2 上 。 写 端口 具有 5 位 地 址 输入 A3, 32 位 数据 输入 WD， 写 入 使 能 WE3 和 
时 钟 信 号 CLK。 如 果 写 入 使 能 为 1， 则 寄存 器 文件 将 在 时 钟 的 上 升 沿 将 数据 写 人 特定 寄存 器 。 

数据 存储 器 (data memory) 有 一 个 读 / 写 端口 。 如 果 写 使 能 WE 为 1， 则 在 时 钟 的 上 升 沿 将 
数据 WD 写 入 地址 4。 如 果 写 使 能 为 0， 则 从 地 址 4 将 数据 读 到 RD, 

指令 存储 器 、 寄 存 器 文件 和 数据 存储 器 在 读 出 过 程 中 都 呈现 组 合 逻 辑 特征 。 换 句 话 说， 如 
果 地 址 发 生 改变 ， 新 的 数据 在 多 个 传播 延迟 后 出 现在 RD 上 ， 而 不 需要 时 钟 参 与 。 而 写 人 过 程 
仅仅 在 时 钟 的 上 升 沿 发 生 。 在 此 模式 下 ， 系 统 状态 只 在 时 钟 沿 发 生 改 变 。 地 址 、 数 据 和 写 使 能 
必须 在 时 钟 沿 前 建立 ， 而 且 必 须 稳定 直到 时 钟 沿 后 的 保持 时 间 。 

由 于 状态 元 件 仅 在 时 钟 的 上 升 沿 改变 它们 的 状态 ， 所 以 它们 是 同步 时 序 电路 。 微 处 理 需 由 


O ”在 处 理 指令 存储 器 为 ROM 时 ， 存 在 过 度 简化 。 在 大 多 数 实际 处 理 器 中 ， 指 令 存 储 器 必须 是 可 写 的 ， 从 而 使 
操作 系统 可 以 载 人 一 个 新 的 程序 到 存储 器 中 。7. 4 节 所 描述 的 多 周期 微 结构 更 符合 实际 ， 它 使 用 混合 存储 器 
来 存储 指令 和 数据 ， 使 得 它们 既 可 读 又 可 写 。 
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时 钟 驱 动 的 状态 元 件 和 组 合 逻 辑 构成 ， 因 此 它 也 是 同步 时 序 电路 。 的 确 ， 处 理 器 可 以 看 作 一 个 
巨大 的 有 限 状态 机 ， 或 者 多 个 简单 相互 作用 的 状态 机 的 组 合 。 


7. 1.3 MIPS 微 体 系 结构 


在 本 章 中 ， 我 们 将 研究 3 种 MIPS 处 理 絮 体系 结构 的 微 体系 结构 ， 单 周 期 、 多 周期 和 流水 
线 。 它 们 的 区 别 在 于 状态 元 件 的 连接 方式 和 非 体系 结构 状态 的 数量 。 

单 周 期 微 体 系 结构 (single cycle microarchitecture ) 在 一 个 周期 中 执行 一 条 完整 的 指令 。 该 结 
构 易 于 解释 且 控 制 单元 简单 。 由 于 它 在 一 个 周期 内 完成 操作 ， 所 以 它 不 需要 其 他 非 体系 结构 状 
态 。 然 而 ， 时 钟 周期 由 最 慢 的 指令 决定 。 

多 周期 微 体系 结构 (multicycle microarchitecture ) 利用 多 个 较 短 的 周期 执行 一 条 指令 。 简 单 
指令 的 执行 周期 数 较 少 。 而 且 ， 多 周期 微 体系 结构 可 以 通过 对 加 法 器 和 存储 器 等 昂贵 硬件 部 件 
的 复 用 减少 硬件 成 本 。 例 如 ， 同 一 个 加 法 堪 可 以 在 一 条 指令 的 不 同时 钟 周 期 中 用 于 不 同 目 的 。 
多 周期 微 体系 结构 需要 增加 一 些 非 体系 结构 寄存 器 来 保存 中 间 结 果 。 多 周期 处 理 器 在 任意 时 刻 
仅 执行 一 条 指令 ， 但 是 每 条 指令 需要 多 个 周期 。 

流水 线 微 体系 结构 (pipeline microarchitecture ) 将 单 周 期 微 体 系 结 构 流 水 线 化 ， 使 得 可 以 同 
时 执行 多 条 指令 ， 显 著 提高 了 吞吐 量 。 流 水 线 结构 必须 增加 一 些 逻 辑 来 处 理 多 条 正在 执行 指令 
之 间 的 相关 性 。 同 时 ， 还 需要 增加 非 体系 结构 流水 线 寄 存 器 。 增 加 这 些 逻 辑 和 寄存 器 是 值得 
的 。 当 前 ， 所 有 的 商业 高 性 能 处 理 器 都 使 用 流水 线 结构 。 

我 们 将 在 后 面 的 各 节 中 研究 这 3 种 微 体系 结构 的 细节 和 特征 。 本 章 结尾 将 简要 介绍 在 现代 
高 性 能 微 处 理 器 中 为 了 获得 更 高 速度 而 采用 的 技术 。 


7.2 性 能 分 析 


如 前 所 述 ， 一 个 特殊 处 理 器 体系 结构 可 以 有 不 同 的 微 体系 结构 ， 具 有 不 同 的 成 本 和 性 能 折 
中 。 成 本 取决 于 所 需 硬件 的 数量 和 实现 工艺 。 对 于 同样 的 价格 ， 每 年 CMOS 工艺 都 可 以 在 一 个 
尾 片 上 集成 更 多 的 晶体 管 ， 处 理 器 可 以 利用 这 些 新 增加 的 晶体 管 来 提升 性 能 。 精 确 的 成 本 计算 
需要 实现 技术 的 专业 知识 ， 但 是 一 般 而 言 ， 越 多 的 门 和 存储 器 就 需要 越 大 的 成 本 。 本 节 主 要 为 
分 析 性 能 奠定 基础 。 

有 很 多 方法 可 以 测量 计算 机 系统 的 性 能 。 而 销售 部 门 往往 选择 一 些 让 计算 机 看 起 来 更 快 的 
方法 来 测量 ， 而 不 管 这 些 测 量 是 否 与 真实 性 能 相关 。 例 如 ，Intel 公司 和 AMD 公司 同时 销售 支 
持 x86 体系 结构 的 微 处 理 器 。 在 20 世纪 90 年 代 末 和 21 世纪 初 ，Intel Pentium II 和 Pentium 4 
微 处 理 硕 因 其 时 钟 频 率 较 高 而 大 做 广告 。 然 而 ， 其 主要 竞争 对 手 AMD 公司 的 Athlon 微 处 理 器 
在 同样 的 时 钟 频率 时 性 能 却 优 于 Intel 公司 的 产品 。 消 费 者 应 该 如 何 选 择 ? 

测量 性 能 最 直接 的 方法 就 是 直接 测试 用 户 所 需要 程序 的 执行 时 间 : 所 需要 时 间 较 短 的 计算 
机 系统 的 性 能 更 高 。 在 用 户 还 没有 完成 自己 的 程序 或 者 没有 人 为 用 户 测量 性 能 时 ， 另 一 种 好 的 
方法 是 测量 一 组 类 似 用 户 应 用 的 程序 集合 的 运行 时 间 总 和 。 这 样 的 一 组 程序 称 为 基准 测试 程序 
(benchmark) ， 而 这 些 程序 的 执行 时 间 往 往 公 开 给 出 处 理 器 的 性 能 。 

一 个 程序 的 执行 时 间 ( 以 秒 为 单位 ) 由 式 (7-1) 给 出 : 

$ 令 执行 时 间 = 指令 数 x (ABE). (E) (7-1) 

程序 中 所 包含 的 指令 数 取 决 于 处 理 器 的 体系 结构 。 有 些 处 理 器 具有 复杂 指令 ， 可 以 在 一 条 
指令 中 执行 更 多 的 功能 ， 因 此 可 以 减少 程序 中 的 指令 的 数目 。 人 然而， 这些 复杂 指令 往往 硬件 实 
现 比较 慢 。 指 令 数 往往 在 很 大 程度 上 也 取决 于 程序 员 的 聪明 才智 。 对 于 本 章 而 言 ， 我 们 假设 执 
行 的 都 是 MIPS 处 理 器 上 已 有 的 程序 ， 因 此 每 个 程序 的 指令 数 都 是 固定 的 ， 与 微 体系 结构 无 关 。 
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每 条 指令 的 周期 数 ( CPI) 是 执行 一 条 平均 指令 所 需要 的 时 钟 周期 数 。 它 是 吞吐 量 (每 周期 的 指 
&, IPC) 的 倒数 。 不 同 的 微 体系 结构 具有 不 同 的 CPI 值 。 在 本 章 中 ,我 们 假设 采用 了 理想 的 存储 
做 系 统 而 不 会 影响 CPI。 在 第 8 章 中 ,我 们 将 发 现 处 理 器 有 时 需要 等 待 存储 器 ， 它 将 增加 CPL. 

每 个 周期 所 需要 的 时 间 为 时 钟 周 期 7.。 时 钟 周期 由 处 理 器 中 通过 逻辑 的 关键 路 径 决定 。 不 
同 的 微 体系 结构 有 不 同 的 时 钟 周 期 。 逮 辑 和 电路 设计 也 在 很 大 程度 上 影响 着 时 钟 周期 。 例 如 ， 
先行 进位 加 法 器 的 速度 比 行 波 进位 加 法 器 快 。 制 造 工 艺 的 进步 使 得 晶体 管 速度 每 4 ~6 年 提高 
一 倍 ， 这 样 即使 微 体 系 结 构 和 逻辑 不 发 生变 化 ， 现 在 的 微 处 理 器 速度 也 比 十 年 前 的 快 很 多 。 

微 体 系 结构 的 挑战 在 于 选择 合适 的 设计 来 最 大 地 减 小 程序 执行 时 间 ， 同 时 满足 成 本 和 功 耗 
方面 的 限制 。 由 于 微 体系 结构 对 CP 和 了. 都 有 很 大 影响 ， 而 且 又 受到 逻辑 和 电路 设计 的 影响 ， 
所 以 决定 最 优 的 设计 需要 精细 的 分 析 。 

计算 机 系统 中 有 很 多 因素 对 整体 性 能 有 影响 。 例 如 ， 硬 盘 、 存 储 器 、 图 形 系统 和 网 络 连接 
等 方面 都 是 与 处 理事 性 能 相关 的 因素 。 现 实 世 界 中 最 快 的 微 处 理 器 也 不 能 帮助 提高 拨号 连接 因 
特 网 的 速度 。 但 是 这 些 因素 已 经 超出 了 本 书 的 范围 。 


7.3 HARER 

我 们 首先 设计 一 个 在 单个 周期 执行 指令 的 MIPS 微 体系 结构 。 通 过 将 图 7-1 中 的 状态 元 件 
与 执行 不 同 指令 的 组 合 逻 辑 连接 来 构建 关键 路 径 。 控 制 信号 决定 任何 时 刻 数据 通路 执行 的 具体 
指令 。 控 制 器 包括 根据 当前 指令 产生 的 合适 控制 信号 的 组 合 逻 辑 。 本 节 的 最 后 将 分 析 单 周期 处 
理 器 的 性 能 。 


7.3.1 单 周 期 数据 路 径 

本 节 将 一 次 给 图 7-1 增加 一 个 状态 元 件 ， 逐 步 构 成 单 周 期 数据 路 径 。 新 的 连接 将 以 黑体 高 
亮 显示 (新 的 控制 信号 将 使 用 黑色 细 线 ) ， 而 已 经 研究 过 的 硬件 则 用 灰色 显示 。 

程序 计数 器 (PC) 寄 存 器 包含 执行 指令 的 地 址 。 第 一 步 是 从 指令 存储 器 中 读 取 这 个 指令 。 图 7-2 
显示 PC 简单 地 连接 到 指令 存储 器 的 地 址 输入 。 指 令 存储 器 取出 (fetch)32 位 指令 ， 标 记 为 Instr。 
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图 7-2 从 存储 器 中 取 指 令 


处 理 器 的 动作 取决 于 取出 的 具体 指令 。 首 先 , 我 们 将 针对 lw 指令 构造 数据 路 径 连 接 。 然 
后 ,我 们 将 考虑 如 何 泛 化 该 数据 路 径 来 处 理 其 他 指令 。 

对 于 lw 指令 ， 下 一 步 是 读 包含 基地 址 的 源 寄存 器 。 这 个 寄存 器 由 指令 Instr,,.., 的 rs 字段 
指定 。 指 令 中 的 这 些 位 连接 到 寄存 器 文件 读 端口 的 地 址 输出 Al ， 如 图 7-3 所 示 。 寄 存 器 文件 将 
寄存 器 值 读 入 RD1 。 





图 7-3 ”从 寄存 器 文件 中 读 源 操作 数 
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lw 指令 还 需要 一 个 侦 移 量 ， 它 存储 在 指令 Instriso 的 立即 数字 段 中 。 由 于 16 位 立即 数 可 能 
为 正 数 或 负数 ， 所 以 它 必须 符号 扩展 为 32 位 ， 如 图 7-4 所 示 。32 位 符号 扩展 值 称 为 SignImm。 
在 1.4.6 节 中 符号 扩展 只 是 简单 地 将 较 短 输入 的 符号 位 (最 高 有 效 位 ) 直接 复制 到 较 长 输出 的 高 
位 。 具 体 地 ，SignImm,;。 =Instr,,,, Signimm,, ,, = Instr,, o 





图 7-4 符号 扩展 立即 数 


处 理 右 必须 将 基地 址 与 偏 移 量 相 加 来 得 到 读 存 储 器 的 地 址 。 图 7-5 引入 一 个 ALU 来 执行 加 
法 。 这 个 ALU 接收 两 个 操作 数 SrcA 和 SreB， 其 中 SrcA 来 自 寄 存 器 文件 ，SrcB 来 自 符号 扩展 立 
即 数 。 如 5. 2. 4 节 所 述 ，ALU 可 以 执行 多 种 操作 。3 位 ALU 控制 ALUControl 信号 决定 了 操作 类 
型 。ALU 产生 32 位 的 操作 结果 ALUResult 和 表示 ALUResult 是 否 为 0 的 零 标 志 Zeros, XF lw 
指令 ，ALUControl 信和 号 应 该 设置 为 010， 以 便 执行 基地 址 与 偏 移 量 相 加 。 将 ALUResult 发 送 到 
作为 装 人 指令 地 址 的 数据 存储 器 ， 如 图 7-5 所 示 。 


ALUControlL 。 





图 7-5 “计算 存储 器 地 址 


将 数据 从 数据 存储 器 读 到 ReadData 总 线 上 ， 然 后 将 在 时 钟 周期 的 结尾 将 数据 写 回 寄存 器 ， 
文件 中 的 目的 寄存 部 ， 如 图 7-6 所 示 。 寄 存 器 文件 中 的 端口 3 是 写 端口 。1w 指令 的 目的 寄存 器 
由 zt 字段 的 Instr, EE, 它 连 接 到 寄存 器 文件 的 端口 3 的 地 址 输入 A3。ReadData 总 线 连接 
到 寄存 融 文 件 的 端口 3 的 写 数据 输入 WD3。 控 制 信号 RegWrite 连接 到 端口 3 的 写 和 信使 能 输入 
WE3 ， 该 信号 在 执行 lw 指令 时 将 被 设置 为 1， 这 样 数据 值 可 以 写 和 人 寄存 器 文件 。 写 发 生 在 周 
期 结尾 的 时 钟 的 上 升 沿 。 

指令 执行 时 ， 处 理 器 必须 计算 下 一 条 指令 的 地 址 PC"。 因 为 指令 都 是 32 位 ， 即 4 字 节 ， 所 
以 下 一 条 指令 位 于 PC +4。 图 7-7 使 用 另 一 个 加 法 器 对 PC 递增 4。 新 的 地 址 将 在 下 一 个 时 钟 的 
上 升 沿 写 人 程序 计数 器 。 这 就 完成 了 lw 指令 的 数据 路 径 。 

下 一 步 ， 扩 展 数 据 路 径 来 处 理 sw 指令 。 与 lw 指令 类 似 ，sw 指令 从 寄存 器 文件 的 端口 1 
读 出 基地 址 ， 并 符号 扩展 立即 数 。ALU 将 基地 址 与 立即 数 相 加 获得 存储 器 地 址 。 所 有 这 些 功 能 
都 已 经 得 到 数据 路 径 的 支持 。 


RegWrite ALUControl,,, 





图 7-6 向 寄存 器 文件 写 人 数据 


RegWrite ALUControl, , 


ALUResult 





图 7-7 确定 PC 的 下 一 个 指令 的 地 址 


sw 指令 还 需要 从 寄存 器 文件 中 读 出 第 二 个 寄存 器 并 将 它 写 人 数据 存储 器 中 。 图 7-8 给 出 
了 实现 这 个 功能 的 新 连接 。 该 寄存 器 由 rt FE Instr, 1 确定。 指令 的 这 些 位 连接 到 第 二 个 寄存 
器 文件 的 读 端口 A2。 将 寄存 器 值 读 人 RD2 端口 。 它 连接 到 数据 存储 器 的 写 数 据 端口 。 数 据 存 
储 器 的 写 人 使 能 端口 WE 由 MemWrite 控制 。 对 于 sw 指令 ，MemWrite =1， 向 存储 器 写 人 数据 ; 
ALUControl =010 ， 将 基地 址 和 偏 移 量 相 加 ; RegWrite =0， 因 为 没有 要 写 人 寄存 器 文件 的 数据 。 
需要 注意 的 是 ， 数 据 仍然 从 给 出 的 地 址 读 入 数据 存储 器 ， 只 是 因为 RegWrite =0 所 以 ReadData 
被 忽略 。 

下 一 步 ， 考 虑 扩展 数据 路 径 来 处 理 R 类 型 指令 add. sub, and, or Alslt. 所 有 这 些 指 
令 都 从 寄存 器 文件 中 读 取 两 个 寄存 器 ， 对 它们 执行 某 个 ALU 操作 ， 并 将 结果 写 回 第 三 个 寄存 
器 文件 。 它 们 的 区 别 仅仅 在 于 具体 的 ALU 操作 。 因 此 ， 它 们 可 以 由 同一 个 硬件 结构 实现 ， 使 
用 不 同 的 ALUControl 信号 。 

图 7-9 给 出 了 执行 R 类 型 指令 的 扩展 的 数据 路 径 。 寄 存 器 文件 读 出 两 个 寄存 器 。ALU 对 这 
两 个 寄存 器 执行 操作 。 在 图 7-8 中 ，ALU 总 是 接收 它 的 来 自 符 号 扩展 立即 数 (SignImm) 的 SrcB 
操作 数 。 现 在 ， 我 们 需要 增加 一 个 复 用 器 ， 以 便 从 寄存 器 文件 RD2 端口 或 SignImm 选择 SrcB。 

复 用 器 由 一 个 新 的 信号 ALUSre 控制 。 对 于 R 类 型 指令 ， 当 ALUSre 为 0 时 ， 从 寄存 器 文件 
选择 SrcB; 为 1 时， 选择 SignImm 来 执行 lw 和 sw 指令 。 这 种 通过 增加 复 用 器 来 从 多 个 可 能 输 
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入 中 选择 输入 的 数据 路 径 扩 展 方法 非常 有 用 。 实 际 上 ， 我 们 将 两 次 使 用 这 种 方法 来 完成 R 类 型 
指令 的 处 理 。 


RegWrite ALUControl MemWrite 





图 7-8 对 于 swith’, ARGS AF fina 


RegWrite RegDst ALUSre ALUControl,., Mem Write MemtoReg 
l 0 varies 0 


指令 
存储 器 
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图 7-9 R 类 型 指令 的 数据 路 径 扩 展 


在 图 7-8 中 ， 寄 存 器 文件 总 是 从 数据 存储 器 中 获取 它 的 写 数据 。 然 而 ，R 类 型 指令 需要 将 
ALUResult 写 人 寄存 器 文件 。 因 此 ， 我 们 增加 另 一 个 复 用 器 在 ReadData 和 ALUResult 之 间 选 择 。 
我 们 将 它 的 输出 称 为 Result。 这 个 复 用 器 由 另 一 个 新 的 信号 MemtoReg 来 控制 。 对 R 类 型 指令 ， 
当 MemtoReg 为 0 时 ， 从 ALUResult 中 选择 Result; 对 于 lw 指令 ， 为 1 时， 选择 ReadData, A 
为 sw 指令 不 需要 写 寄 存 需 文件 ， 所 以 对 于 sw， 我 们 不 关心 MemtoReg 的 值 。 

最 后 ， 我 们 扩展 数据 路 径 来 处 理 beq A. bea 指令 比较 两 个 寄存 器 。 如 果 两 个 寄存 器 
相等 ， 则 在 当前 PC 值 上 加 上 分 支 偏 移 量 来 执行 分 支 。 注 意 偏 移 量 存放 在 指令 的 imm 字段 In- 
striso。 ， 它 可 以 为 正 数 或 者 负数 。 偏 移 量 表明 分 支 经 过 的 指令 数 。 因 此 ， 立 即 数 需 要 进行 符号 扩 
展 并 乘 以 4， 获 得 新 的 PC 值 : PC’ = PC +4 + SigImm x4, 

图 7-10 给 出 了 对 数据 路 径 的 修改 。 用 于 分 支 的 下 一 个 PC 值 PCBranch 由 SigImm 左 移 2 位 
并 加 上 PCPlus4 得 到 。 左 移 2 位 是 实现 乘 以 4 的 简单 方法 ， 因 为 固定 位 数 移 位 只 是 将 线 重 排 。 
通过 使 用 ALU 计算 SreA - SrcB 来 比较 两 个 寄存 器 。 如 果 ALUResult 为 0， 即 ALU 的 Zero 标志 
有 效 ， 则 两 个 寄存 器 相等 。 通 过 增加 一 个 复 用 器 从 PCPlus4 和 PCBranch 中 选择 PC’, MIRADA 
支 指令 上 且 Zero 标志 有 效 ， 则 选择 PCBranch。 因 此 ， 当 前 指令 为 beq 时 Branch 信号 为 1， 其 余 
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情况 为 0。 对 于 beq 指令 ，ALUControl =110， 这 样 ALU 执行 减法 操作 。ALUSre =0， 从 寄存 器 
文件 中 选择 SerB。 因 为 给 分 支 指令 不 需要 写 寄 存 器 文件 或 存储 器 ， 所 以 RegWrite 和 MemWrite 
均 为 0。 由 于 不 需要 写 寄 存 器 文件 ， 所 以 我 们 不 需要 关心 RegDst 和 MemtoReg 的 值 。 


PCSrc 





RegWrite RegDst ALUSre ALUControl,., Branch Mem Write MemtoReg 
l 


图 7-10 beq 指令 的 数据 路 径 扩 展 


此 时 ,我 们 已 经 完成 了 单 周期 MIPS 处 理 器 数据 路 径 的 设计 。 这 里 不 仅 介绍 设计 本 身 ， 更 
重要 的 是 其 设计 过 程 。 在 这 个 设计 过 程 中 ， 首 先 明确 状态 元 件 ， 然 后 将 系统 地 加 入 连接 这 些 状 
态 元 件 的 组 合 逻 辑 。 在 下 一 节 中 ， 我 们 将 考虑 如 何 计算 指导 数据 路 径 操 作 的 控制 信号 。 


7.3.2 单 周 期 控制 


控制 单元 基于 指令 的 opcode 字段 (Instr, ，) 和 funct 字段 (Instr,, ) 计 算 控 制 信号 。 图 7-11 
给 出 了 整个 单 周 期 MIPS 处 理 器 结构 图 ， 其 中 控制 单元 已 经 连接 到 数据 路 径 。 





图 7-11 完整 的 单 周期 MIPS Xb ae 


大 多 数控 制 信息 来 自 opcode 字段 ,但 是 R 类 型 指令 也 使 用 funct 字段 决定 ALU RE, 
因此 ， 我 们 将 控制 单元 分 成 两 个 组 合 逻 辑 部 分 来 简化 设计 ， 如 图 7-12 WR ERAMA op- 
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code 中 计算 大 部 分 的 输出 信号 ， 同 时 它 也 产生 一 个 两 位 的 ALUOp 信号 。ALU 译 码 器 使 用 


ee wr wer rr Hr wr rr rr rrr rr mnn 


MemtoReg 
MemWrite 





ALUControl,» 


吉本 | 本 本 


图 7-12 控制 单元 内 部 结构 
表 7-1 ALUOp 编码 


ALUOp 含义 ALUOp 含义 
的 加 法 10 依赖 于 func 字段 
01 减法 11 无 定义 


表 7-2 Jy ALU 译 码 器 的 真 值 表 。3 个 ALUControl 信号 的 含义 如 表 5-1 所 示 。 由 于 ALUOp 不 
可 能 为 11， 所 以 真 值 表 中 不 可 能 使 用 无 关 项 XI 和 1X， 而 使 用 01 和 10 来 简化 逻辑 。 当 ALUOp 
为 00 或 01 时 ，ALU 应 该 为 加 法 或 减法 。 当 ALUOp 为 10 时 ， 译 码 絮 检查 funct 字段 来 确定 
ALUControl 信和 号。 注意 我 们 实现 的 R 类 型 指令 中 ，funct 字段 的 最 高 两 位 总 是 10， 因 此 可 以 
忽略 它们 来 简化 设计 。 


表 7-2 ALU 译 码 器 真 值 表 


ALUOp Funct ALUControl 
00 X 010( 加 ) 
XI X 110 ( mm ) 
1X 100000 ( add) 010( hin) 
1X 100010( sub) 110( dak ) 
1X 100100( and) 000 ( 45) 
1X 100101 (or) 001 ( 3%) 
1X 101010( sit) 111( 小 于 置 位 ) 


在 创建 数据 路 径 时 ， 我 们 已 经 介绍 了 每 条 指令 的 控制 信号 。 表 7-3 是 汇总 了 作为 opcode 
功能 的 控制 信号 的 主 译 码 器 的 真 值 表 。 所 有 的 R 类 型 指令 使 用 相同 的 主 译 码 器 值 ， 它 们 的 不 同 
仅仅 在 于 ALU 译 码 右 输 出 。 对 于 不 需要 写 寄存 髓 文件 的 指令 (如 ，sw 和 beg), RegDst 和 
MemtoReg 控制 信号 是 无 关 项 (为 X)。 因 为 RegWrite 信号 无 有 效 ， 所 以 寄存 器 写 端 口 的 地 址 和 
数据 都 无 需 考虑 。 译 码 器 逻辑 可 以 根据 读者 偏好 的 组 合 逻 辑 设计 技术 来 实现 。 


表 7-3 主 译 码 器 真 值 表 


指令 Opcode RegWrite RegDst ALUSre Branch MemWrite MemtoReg ALUOp 
R 类 型 000000 ] 1 0 0 0 0 10 
lw 100011 ] 0 ] 0 0 l 00 
SW 101011 0 X 1 ga. ] X 00 
beq 000100 0 X 0 1 0 X 01 
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单 周期 处 理 器 操作 

当 执行 or 指令 时 ， 确 定 所 使 用 的 控制 信号 的 值 和 数据 路 径 的 实际 路 径 。 

解 : 图 7-13 给 出 了 执行 or 指令 时 的 控制 信号 和 数据 流 。PC 指向 保存 指令 的 存储 器 位 置 ， 
指令 存储 器 取出 指令 。 


MemtoReg 
a MemWrite 


0 
\/ 
RD |ReadData 


WE 
A 

数据 
lag 





图 7-13 执行 or 指令 时 的 控制 信号 和 数据 流 


经 过 寄存 器 文件 和 ALU 的 主 数据 流 用 黑色 虚线 画 出 。 寄 存 器 文件 读 出 Instr A Instr, th 
定 的 操作 数 。SrcB 应 该 来 自 寄存 器 文件 的 第 2 个 端口 (而 不 是 SignImm) ， 所 以 ALUSre 必须 为 
0。or 为 R 类 型 指令 ， 因 此 ALUOp 为 10， 表 示 funct 字段 确定 的 ALUControl 信号 为 001。 结 
果 从 ALU 中 读 出 ， 因 此 MemtoReg 为 0。 结果 写 人 寄存 器 文件 ， 因 此 RegWrite 为 1。 指令 不 需 
要 写 存储 器 ， 因 此 MemWrite 为 0。 

目的 寄存 器 的 选择 也 由 黑色 虚线 画 出 。 目 的 寄存 器 由 rd 字段 (Instrs, ) 确 定 ， 因 此 
RegDst =1。 

PC 的 更 新 由 灰色 虚线 画 出 。 指 令 不 是 分 支 指令 ， 因 此 Branch =0， 因 此 PCSre 也 为 0。PC 
从 PCPlus4 获得 下 一 个 值 。 

注意 数据 肯定 经 过 没有 加 粗 表 示 的 路 径 ， 但 是 这 些 数据 的 值 对 这 条 指令 并 不 重要 。 例 如 ， 
立即 数 也 经 过 了 符号 扩展 ， 数 据 从 存储 器 读 出 ， 但 是 这 些 值 并 不 影响 系统 的 下 一 个 状态 。 od 


7.3.3 更 多 指令 


我 们 已 经 考虑 了 整个 MIPS 指令 系统 中 的 一 个 有 限 的 子 集 。 下 面 ， 我 们 将 增加 addi 指 
ee aa e a A ga e 2 
到 ， 支 持 某 些 指令 仅仅 需要 扩展 主 译 码 器 就 可 以 实现 ， 而 支持 另 一 些 指令 则 需要 在 数据 路 径 中 
增加 更 多 的 硬件 。 

addi 指令 

加 立即 数 指令 addi 将 寄存 器 中 的 值 与 立即 数 相 加 ， 并 将 结果 写 人 另 一 个 寄存 器 中 。 数 据 
路 径 已 经 可 以 完成 这 个 任务 。 修 改 控制 器 来 支持 addi 指令 。 

R: 我 们 需要 做 的 仅仅 是 在 主 译 码 器 真 值 表 内 为 addi 指令 加 上 一 行 控制 信号 ， 如 表 7-4 
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所 示 。 结 果 应 该 写 人 寄存 器 文件 ， 因 此 RegWrite=1, 目的 寄存 器 由 指令 的 rt 字段 决定 ， 因 此 
RegDst =0。SrcB 来 自立 即 数 ， 因 此 ALUSre = 1。 指 令 不 是 分 支 指 令 ， LAS haat, Ast 
Branch = MemWrite =0。 结 果 来 自 ALU， 而 不 是 存储 器 ， 因 此 MemtoReg =0。 最 后 ，ALU 应 该 
执行 加 法 操作 ， 因 此 ALUOP =00, 


表 7-4 扩展 支持 addi 指令 的 主 译 码 器 真 值 表 


指令 Opcode RegWrite RegDst ALUSre Branch MemWrite MemtoReg ALUOp 

R 类 型 000000 1 1 0 0 0 0 10 
lw 100011 l 0 l 0 0 1 00 
Sw 101011 0 X ] 0 ] X 00 
beq 000100 0 X 0 1 0 X 01 
addi 001000 1 0 ] 0 0 0 00 
< 
j 指令 


跳 转 指令 j 将 向 PC 写 人 一 个 新 值 。 因 为 PC 是 字 对 齐 的 ( 总 能 被 4 整除 ) ， 所 以 PC 的 最 低 
2 位 始终 为 0。 后 面 的 26 位 来 自 跳 转 地 址 字段 Instrs.。。 高 4 位 保持 PC 的 原来 值 。 

已 有 的 数据 路 径 缺 少 按 此 方式 计算 PC' 的 硬件 。 请 修改 数据 路 径 和 控制 融 来 支持 j 指令 。 

解 : 首先 ， TE j 指令 情况 下 必须 增加 硬件 来 计算 下 一 个 PC 值 PC'， 并 增加 一 个 复 用 器 来 
选择 下 一 个 PC， 如 图 7-14 所 示 。 这 个 新 的 复 用 需 使 用 Jump 控制 信号 。 





图 7-14 扩展 单 周期 MIPS 数据 路 径 来 支持 j 指令 


现在 必须 在 主 译 码 器 真 值 表 中 为 j 指令 增加 一 行 ， 为 Jump 控制 信号 增加 一 列 ， 如 表 7-5 
所 示 。Jump 控制 信号 在 j 指令 时 为 1， 所 有 其 他 指令 均 为 0。j 指令 不 写 寄存 器 文件 和 存储 器 ， 


因此 RegWrite = MemWrite =0。 因 此 ， 我 们 不 需要 关系 数据 路 径 中 的 计算 ， 且 RegDst = ALUSrc = 
Branch = MemtoReg = ALUOp = X, 
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表 7-5 扩展 主 译 码 器 真 值 表 来 支持 j 指令 


指令 Opcode RegWrite RegDst ALUSre Branch MemWrite MemtoReg §ALUOp Jump 
R 类 型 000000 | 1 0 0 0 0 10 0 
lw 100011 ] 0 l 0 0 l 00 0 
SW 101011 0 X 1 0 l X 00 0 
beq 000100 0 X 0 l 0 X 01 0 
addi 001000 l 0 l 0 0 0 00 0 
j 000010 0 X X X 0 X XX 1 
< 
7.3.4 性 能 分 析 


在 单 周 期 处 理 器 中 ， 每 条 指令 需要 一 个 时 钟 周期 ， 因 此 CPI 为 1。1w 指令 的 关键 路 径 如 

图 7-15 中 的 黑色 虚线 所 示 。 它 在 PC 在 时 钟 的 上 升 沿 装 入 新 的 地 址 开始 。 指 令 存 储 器 读 出 下 一 

条 指令 。 寄 存 器 文件 读 出 SrcA。 在 寄存 器 文件 读 的 同时 ， 对 立即 数字 段 进 行 符 号 扩展 并 在 

ALUSre 复 用 器 上 选择 立即 数字 段 的 值 来 确定 SrcB, ALU 将 SrcA 和 SrcB 相 加 得 到 有 效 地 址 。 数 

据 存储 器 从 这 个 地 址 读 取 数据 。MemtoReg 42 FA ak 267% ReadData。 最 后 ， 结 果 必 须 在 下 一 个 上 
升 时 钟 沿 前 建立 在 寄存 器 文件 中 ， 这 样 它 才能 被 正确 写 人 。 因 此 ， 时 钟 周期 为 : 

7 to e a, t MO ha FEY + tig toe BLS then (7-2) 

在 绝 大 多 数 实 现 技 术 中 ，ALU 、 存 储 器 和 寄存 器 文件 都 比 其 他 操作 慢 很 多 。 因 此 ， 时 钟 周 

期 可 以 简化 为 : 
1 


(7-3) 
这 些 时 间 的 数值 依赖 于 特定 的 实现 技术 。 


RFsetup 


ees 





图 7-15 1w 指令 的 关键 路 径 
其 他 指令 的 关键 路 径 都 比较 得。 例如 ，R 类 型 指令 不 需要 访问 数据 存储 器 。 然 而 ， 我 们 采 
用 同步 时 序 设计 ， 因 此 时 钟 周期 是 常数 ， 而 且 必 须 足 够 长 以 便 满足 最 慢 的 指令 。 
单 周期 处 理 器 性 能 
Ben Bitdiddle 在 65nm 的 CMOS 工艺 上 创建 单 周 期 MIPS 处 理 器 。 他 选择 的 逻辑 元 件 的 延迟 
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如 表 7-6. 所 示 。 请 帮助 他 比较 有 1000 亿 条 指令 的 程序 的 执行 时 间 。 
表 7-6 电路 元 件 的 延迟 


元 件 参数 延迟 元 件 参数 延迟 
寄存 器 时 钟 到 Q 时 间 tpeq 30 存储 器 读 bi 250 
寄存 器 建立 时 间 letup 20 寄存 器 文件 读 ORF ead 150 
复 用 器 tmux 25 寄存 器 文件 建立 时 间 RF setup 20 
算术 逻辑 单元 1ALU 200 


解 : 根据 式 (7-3) ， 单 周期 处 理 需 的 周期 时 间 为 T, =30 +2(250) +150 +200 +25 +20 = 
925ps。 这 里 使 用 下 标 “1” 来 区 别 于 后 续 的 处 理 器 设计。 根据 式 (7-1) ， 总 的 计算 时 间 为 卫 = 
(100 x 10°4§4>) (1 周期 /指令 )(925 x 10°" Pb/ AHA) =92. 5 秒 。 4 


7.4 BASE aa 


单 周 期 处 理 器 有 3 PERMA SB, Ei BR Je OK 6 RAS (lw), B 
使 大 部 分 指令 的 速度 都 非常 快 。 第 二 ， 它 需要 3 PUM a (—TS AIF ALU， 两 个 用 于 PC KHE 
辑 ) ， 而 加 法 需 是 相对 占用 忆 片 面积 的 电路 ， 尤 其 是 如 果 它 们 的 速度 比较 快 。 第 三 ， 它 采用 独 
立 的 指令 存储 人 和 数据 存储 器 ， 而 这 在 实际 系统 中 是 不 现实 的 。 大 多 数 计算 机 有 一 个 单独 的 大 
容量 存储 右 来 存储 指令 和 数据 ， 并 且 文 持 读 和 写 操 作 。 

多 周期 处 理 器 通过 将 指令 执行 过 程 分 解 为 多 个 较 短 的 步骤 来 解决 这 些 问 题 。 在 每 个 短 步 又 
中 ， 处 理 器 可 以 读 或 写 存储 器 或 寄存 器 文件 ， 或 者 使 用 ALU。 不 同 的 指令 使 用 不 同 的 步骤 ， 因 
此 简单 指令 可 以 比 复杂 指令 完成 得 更 快 。 处 理 需 只 需要 一 个 加 法 舌 ， 这 个 加 法 需 在 不 同 的 步骤 
可 以 根据 不 同 的 目的 重复 使 用 。 而 且 处 理 需 使 用 一 个 可 以 存储 指令 和 数据 的 组 合 存储 器 。 第 一 
步 从 存储 右 中 取出 指令 ， 而 在 后 续 的 步骤 中 读 出 或 写 入 数据 。 

我 们 使 用 与 单 周期 处 理 器 相同 的 方法 来 设计 多 周期 处 理 右 。 首 先 ， 我 们 通过 将 体系 结构 状 
态 元 件 和 存储 器 与 组 合 逻 辑 连 接 来 创建 一 条 数据 路 径 。 但 是 ,在 此 设计 中 ， 我 们 还 增加 了 非 体 
系 结构 状态 元 件 来 保存 每 个 步骤 之 间 的 中 间 结 果 。 接 着 ， 我 们 设计 控制 器 。 在 每 条 指令 执行 期 
间 控 制 逢 针对 不 同 的 步骤 上 产生 不 同 的 指令 ， 因 此 它 现在 是 有 限 状 态 机 而 不 是 组 合 逻 辑 。 我 们 
还 要 考察 如 何 给 处 理 器 增加 新 的 指令 。 最 后 ， 我 们 分 析 多 周期 处 理 咒 的 性 能 ， 并 将 它 与 单 周期 
处 理 器 进行 比较 。 


7.4.1 多 周期 数据 路 径 


我 们 再 次 以 存储 器 和 MIPS 处 理 器 的 体系 结构 状态 作为 开始 我 们 的 设计 ， 如 图 7-16 所 示 。 
在 单 周 期 设计 中 ， 我 们 使 用 单独 的 指令 和 数据 存储 器 ， 因 为 我 们 需要 在 一 个 周期 内 读 指 令 存 储 
髓 且 读 或 写 数据 存储 器 。 现 在 我 们 选择 使 用 一 个 指令 和 数据 组 合 的 存储 器 。 这 更 符合 实际 情 
况 ， 而 且 它 也 是 可 行 的 ， 因 为 在 一 个 周期 内 读 指 令 ， 然 后 在 单独 的 周期 内 读 或 写 数 据 。PC 和 
寄存 器 文件 保持 不 变 。 我 们 通过 增加 组 件 逐 步 构造 数据 路 径 ， 以 便 处 理 每 条 指令 的 每 个 步骤。 
新 建立 的 连接 使 用 黑色 加 粗 线 表示 (使 用 黑色 细 线 表示 新 的 控制 信号 ) ， 已 加 入 的 硬件 组 件 将 
用 灰色 表示 。 

PC 包含 需要 执行 指令 的 地 址 。 第 一 步 是 从 指令 存储 器 中 读 取 指令 。 图 7-17 显示 了 PC 简 
单 地 连接 到 指令 存储 器 的 地 址 输入 端 。 指 令 读 出 后 存储 在 一 个 新 的 非 体系 结构 状态 元 件 一 一 指 
& 3 4¥ 4 (Instruction Register) 中 供 后 续 周期 使 用 。 指 令 寄 存 器 接收 使 能 信号 IRWrite， 当 此 信号 
用 一 条 新 的 指令 更 新 时 它 有 效 。 
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IRWrite 





图 7-16 统一 的 指令 /数据 存储 器 的 状态 元 件 图 7-17 从 存储 器 中 取 指 令 

与 单 周 期 处 理 器 一 样 ， 我 们 首先 为 1w 指令 建立 数据 路 径 连 接 。 然 后 增加 数据 路 径 来 处 理 
其 他 指令 。 对 于 lw 指令 ， 下 一 个 步骤 将 读 取 包含 基地 址 的 源 寄 和 存 器 。 这 个 寄存 硕 由 指令 中 的 
rs 字段 (Instrs.2 ) 指 定 。 指 令 的 这 些 位 连接 到 寄存 器 文件 的 一 个 地 址 输入 Al ， 如 图 7-18 所 示 。 
寄存 器 文件 将 寄存 器 内 容 读 到 RD1， 这 个 值 存储 到 男 一 个 非 体系 结构 寄存 器 A 中 。 


IR Write 


文件 





图 7-18 从 寄存 器 文件 读 取 源 操作 数 


lw 指令 还 需要 一 个 偏 移 量 。 这 个 偏 移 量 存 储 在 指令 的 立即 数字 段 (Instriso) ， 而 且 必 须 符 
号 扩展 为 32 位 ， 如 图 7-19 所 示 。 经 过 符号 扩展 的 32 位 值 称 为 SignImm。 为 保持 一 致 性 ， 应 该 
将 SignImm 存储 在 另 一 个 非 体 系 结构 寄存 器 中 。 然 而 ，SignImm 是 Instr 的 组 合 功 能 ， 且 在 当前 
指令 处 理 过 程 中 不 会 改变 ， 因 此 不 需要 指定 专用 的 寄存 器 来 存储 这 个 常数 值 。 


IR Write 





图 7-19 符号 扩展 立即 数 


装 人 操作 的 地 址 为 基地 址 与 偏 移 量 的 和 。 我 们 使 用 ALU 计算 这 个 和 ， 如 图 7-20 Pra. 
ALUControl 应 设置 为 010 以 便 完 成 加 法 操作 。ALUResult 存储 在 一 个 非 体 系 结构 寄存 融 
ALUOut 中 。 

下 一 步 是 根据 计算 地 址 从 存储 器 中 装 和 数据。 我 们 在 寄存 器 的 前 面 增加 一 个 复 用 器 以 便 从 
PC 或 者 ALUOut 中 选择 存储 器 地 址 Adr， 如 图 7-21 所 示 。 复 用 器 选择 信号 lorD 来 区 别 指令 或 
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CHE HOE . FEAR aE AP SE h BS TES FF Ti ak TE 5 — SE KR AY AF FF ae Data 中 。 注 意 ， 地 址 
复 用 器 允许 我 们 在 1w 指令 中 重用 存储 器 。 在 第 一 步 ， 地 址 来 自 PC 以 便 读 取 指令 ; 在 后 面 的 
步骤 中 ， 地 址 来 自 ALUOut 以 便装 入 数据 。 因 此 ，IorD 信号 在 不 同 的 周期 中 必须 有 不 同 的 值 。 
在 7.4.2 节 中 ,我 们 设计 产生 这 些 控制 信号 序列 的 FSM PERAE o 


IRWrite ALUControl,,, 







RD? ALUOut 


寄存 器 
WD3 文件 






图 7-20 基地 址 和 偏 移 量 相 加 


lorD IRWrite ALUControl,., 





图 7-21 从 存储 器 中 装 人 数据 


最 后 ， 数 据 将 写 回 到 寄存 器 文件 中 ， 如 图 7-22 所 示 。 目 的 寄存 器 由 指令 的 zt 字段 
(Instr is ) 指定 。 


IorD IRWrite RegWrite ALUControl,, 





ALUResult ALUOut 


图 7-22 将 数据 写 回 到 寄存 器 文件 


在 完成 上 述 操作 后 ， 处 理 器 必须 在 原来 的 PC 上 加 4 来 更 新 程序 计数 器 。 在 单 周期 处 理 器 
中 ， 需 要 一 个 单独 的 加 法 器 。 在 多 周期 处 理 器 中 ， 我 们 可 以 在 现 有 ALU 不 忙 时 使 用 它 。 为 此 ， 
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必须 增加 源 复 用 天 以 便 选 择 PC 和 第 数 4 作为 ALU 输入 ， 如 图 7-23 所 示 。2 输入 复 用 硕 由 
ALUSreA 信号 控制 ， 它 选择 PC 或 寄存 器 和 作为 SrcA。4 输入 复 用 器 由 ALUSrcB 控制 ， 它 选择 
常数 4 或 SignImm 作为 SrceB。 当 扩展 数据 路 径 来 处 理 其 他 指令 使 用 其 他 两 个 复 用 器 输入 ( 复 用 
ane AY Fag A BX AT AE TEENY). AS Ba PC, ALU 将 SreA( PC) Ail SrceB(4) 相 加 ， 并 将 结果 写 入 
程序 计数 融 寄 存 器 中 。PCWrite 控制 信号 将 在 特定 周期 中 使 能 PC ap Apa, ETS PC 寄存 器 可 以 
FAHR o 


PCWnte IorD IRWrite Reg Write ALUSrcA ALUSrcB,.. ALUControl,., 





7-23 PC 递增 4 


此 时 ， 已 经 完成 了 lw 指令 的 数据 路 径 。 下 一 步 ， 我 们 将 扩展 数据 路 径 来 处 理 sw 指令 。 
与 lw 指令 类 似 ，sw 指令 从 寄存 器 文件 的 端口 1 读 出 基地 址 ， 并 对 立即 数 进行 符号 扩展 。ALU 
将 立即 数 与 基地 址 相 加 以 便 获 得 存储 器 地 址 。 数 据 路 径 现 有 硬件 已 经 支持 这 些 功 能 。 

sw 指令 的 唯一 新 特性 是 必须 从 寄存 句 文 件 中 读 出 第 二 个 寄存 器 并 将 它 写 人 存储 器 中 ， 如 
图 7-24 所 示 。 这 个 寄存 器 由 指令 中 的 rt 字段 ( Instr0.16 ) 指 定 ， 这 个 字段 连接 到 寄存 圳 文件 的 
第 二 个 端口 上 。 当 读 寄存 器 时 ， 它 存储 在 非 体 系 结构 寄存 器 B 中 。 在 下 一 步 ， 将 它 写 人 数据 存 
储 佑 的 写 数 据 问 口 WD。 数 据 存 储 句 接收 另 一 个 控制 信号 MemWrite 来 表示 应 该 进行 写 操作 。 


PCWnte lorD MemWrite IR Write Reg Write ALUSrcA ALUSrcB,,, ALUControl.,,, 





图 7-24 为 sw 指令 扩展 的 数据 路 径 


对 于 R 类 型 指令 ， 也 要 取出 指令 ， 而 且 从 寄存 器 文件 中 读 取 两 个 源 寄存 器 。 使 用 SrcB 复 
用 器 的 控制 输入 ALUSrcB, ,选择 寄存 器 下 作为 ALU 的 第 二 个 源 寄存 器 ， 如 图 7-25 所 示 。ALU 
执行 相应 的 操作 并 将 结果 存储 在 ALUOut 中 。 在 下 一 步 ， 将 ALUOut 写 回 到 指令 的 rd 字段 
( Instris.1 ) 指定 的 寄存 器 中 。 这 需要 两 个 新 的 复 用 器 。MemtoReg 复 用 器 从 ALUOut( 针对 R 类 型 
指令 ) 或 Data( 针 对 lw 指令 ) 选 择 一 个 作为 WD3; RegDst 指定 选择 指令 的 rt 字段 或 者 ra 字段 
指定 的 目的 寄存 器 。 


244 第 7 章 


PCWrite lorD MemWrite IRWrite RegDst MemtoReg RegWrite ALUSrcA ALUSrcB,,, ALUControl,, 





图 7-25 为 R 类 型 指令 扩展 的 数据 路 径 


对 于 beq 指令 ， 也 要 取出 指令 ， 并 且 从 寄存 器 文件 中 读 取 两 个 源 寄存 器 。 为 了 确定 两 个 
寄存 器 是 否 相 等 ，ALU 将 两 个 寄存 器 的 值 相 减 ， 当 结果 为 0 时 ,将 Zero 标志 设置 为 1。 同 时 如 
果 发 生 转 移 ， 数 据 路 径 必 须 计算 PC 的 下 一 个 值 : PC' = PC +4 +SignImm x4。 在 单 周 期 处 理 器 
中 ， 还 需要 另 一 个 加 法 器 来 计算 分 支 地 址 。 在 多 周期 处 理 器 中 ，ALU 可 以 重用 以 便 减 少 硬件 。 
在 一 步 中 ， 与 其 他 指令 一 样 ，ALU 计算 PC +4 并 将 结果 写 入 程序 计数 器 中 。 在 男 一 步 中 ，ALU 
使 用 更 新 的 PC 值 计算 PC + SignImm x 4。SignImm 左 移 2 位 以 将 它 乘 以 4， 如 图 7-26 所 示 。 
SrcB 复 用 器 选择 这 个 值 ， 并 将 其 与 PC 相 加 并 将 结果 存 人 PC 中 。 和 表示 分 支 的 目的 地 址 并 将 
它 存 储 到 ALUOut 中 。 由 PCSre 信号 控制 的 一 个 新 的 复 用 器 选择 应 该 将 哪 一 个 结果 传送 到 PC’ 
中 。 当 PCWrite 有 效 或 执行 分 文 时 应 该 写 程 序 计 数 器 。 新 的 控制 信号 Branch 表示 beg 指令 正在 
执行 。 如 果 Zero 标志 有 效 ， 则 执行 分 支 。 因 此 数据 路 径 计 算 新 的 PC 写 入 使 能 PCEn, “4 PC- 
Write 有 效 时 或 者 当 Branch 和 Zero 同时 有 效 时 ， 它 为 TRUE。 


PCEn 





lorD MemWriteIR Write RegDst MemtoReg RegWrite ALUSreA ALUSreB,, ALUControl,, Branch PCWrite| PCSrc 


PC’ we v 
| i res 20:16 |_| 
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Fl 7-26 beq 指令 的 扩展 数据 路 径 


此 时 ， 完 成 了 多 周期 MIPS 处 理 器 数据 路 径 的 设计 。 设 计 过 程 非常 类 似 于 单 周 期 处 理 器 ， 
因为 硬件 通过 状态 元 件 系统 地 连接 起 来 ， 以 便 处 理 每 条 指令 。 主 要 区 别 是 指令 执行 需要 经 过 多 
步 。 需 要 插入 非 体系 结构 寄存 器 来 保存 每 步 的 结果 。 在 此 方式 下 ，ALU 可 以 被 多 次 重用 ， 节 省 
了 额外 加 法 融 的 开销 。 类 似 地 ， 指 令 和 数据 可 以 存储 在 一 个 共享 存储 器 中 。 在 下 一 节 中 ， 我 们 
将 开发 FSM 控制 器 以 便 每 条 指令 的 每 步 给 数据 路 径 传送 合适 的 控制 信号 序列 。 


7.4.2 多 周期 控制 
与 单 周 期 处 理 器 一 样 ， 控 制 单 元 根据 指令 的 opcode 字段 Instr,,,) 和 funct 字段 
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(Instrs.o ) 计算 控制 信号 。 图 7-27 给 出 了 完整 的 多 周期 MIPS 处 理 器 的 控制 单元 与 数据 路 径 的 连 
接 。 数 据 路 径 用 黑 线 显示 ， 控 制 单元 用 灰色 显示 。 


Pe 16 EES 
Ii m” 





图 7-27 完整 的 多 周期 MIPS 处 理 需 


与 单 周期 处 理 器 一 样 ， 控 制 单元 分 为 一 个 主 控制 器 和 一 个 ALU 译 码 器 ， 如 图 7-28 所 示 。 
ALU 译 码 顺 不 改变 ， 并 满足 表 7-2 的 真 值 表 。 然 而 ， 现 在 主 控制 器 是 在 合适 的 周期 中 应 用 合适 
的 控制 信号 的 FSM。 控制 信号 序列 依赖 于 当前 正在 执行 的 指令 。 在 本 节 的 后 续 内 容 中 ， 我们 将 
为 主 控制 器 设计 FSM 状态 转换 图 。 


"~~~" 


E 市 单元 — MemtoReg 





en 复 用 器 选择 | 


IRWrite À 
MemWrite ' 
PCWrite wy trae He ， 


图 7-28 控制 单元 内 部 结构 


主 控制 器 产生 数据 路 径 的 复 用 器 选择 和 使 能 信号 。 选 择 信 号 包括 MemtoReg、RegDst、IorD、 
PCSre, ALUSrcB 和 ALUSrcA。 使 能 信号 包括 IRWrite, MemWrite, PCWrite, Branch 和 RegWrite, 
为 了 使 下 面 的 状态 转换 图 可 读 ， 只 列 出 了 相关 的 控制 信号 。 只 有 当 它 们 值 重要 时 ， 才 列 出 
选择 信号 ， 和 否则 它们 是 无 关 项 。 使 能 信号 仅 在 它们 有 效 时 才 列 出 ， 否 则 它们 为 0。 
所 有 指令 的 第 一 步 都 是 根据 PC 中 保存 的 地 址 从 存储 器 中 取出 指令 。FSM 在 复位 后 将 进入 


396 
d 
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这 个 状态 。 为 了 读 存 储 器 ,， 令 IorD =0， 这 样 可 以 从 PC 获得 地 址 。IRWrite 有 效 以 便 将 指令 写 
入 指令 寄存 器 IR 中 。 同 时 ，PC 应 该 递增 4 以 便 指 问 下 一 条 指令 。 由 于 ALU 此 时 没有 被 作为 他 
用 ， 所 以 处 理 器 可 以 在 ALU 取出 指令 的 同时 使 用 它 计算 PC +4。ALUSrcA =0， 因 此 SrcA 来 目 
PC。ALUSrcB =01， 因 此 SrcB 来 自 常 数 4。ALUOP =00， 因 此 ALU 译 码 器 产生 控制 信号 ALU- 
Control =010 使 ALU 执行 加 法 。 为 了 用 这 个 值 更 新 PC， 令 PCSrc =0 并 设置 PCWrite HAR. 
控制 信号 如 图 7-29 所 示 。 在 此 步 的 数据 流 如 图 7-30 所 示 ， 其 中 取 指 令 由 黑色 虚线 表示 ，PC 递 
增 由 灰色 虚线 所 示 。 


SO: Fetch 















lorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSre =0 
IR Write 
PCWrite 


Reset 


图 7-29 Rugs 





图 7-30 取 指 步骤 的 数据 流 


下 一 步 将 读 寄 存 占 文件 ， 并 对 指令 译 码 。 寄 存 器 文件 总 是 读 由 指令 的 rs 和 rt 字段 指定 
的 两 个 源 。 同 时 ， 对 立即 数 进行 符号 扩展 。 译 码 操作 包括 检查 指令 的 opcode 字段 以 便 决定 后 
续 的 操作 。 译 码 指令 不 需要 控制 信号 ， 但 是 需要 等 待 一 个 周期 来 完成 读 和 译 码 ， 如 图 7-31 所 
不。 新 的 状态 由 黑色 虚线 表示 。 数 据 流 如 图 7-32 所 示 。 


SO: Fetch S1: Decode 







lorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSre =0 
IRWrite 
PCWrite 










Reset 


图 7-31 VER 
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ALUControl, , 


are 
ax fe ins 
YIData i 





FA 7-32 译 码 步骤 的 数据 流 


现在 FSM 根据 opcode 产生 多 个 可 能 的 状态 之 一 。 如 果 指 令 是 存储 器 装 入 或 存储 (1w 或 sw), 
则 多 周期 处 理 器 通过 将 基地 址 和 符号 扩展 的 立即 数 相 加 来 计算 地 址 。 这 需要 ALUSreA =1 以 便 选 择 寄 
存 器 4，ALUSrcB = 10 以 便 选择 SignImm。ALUOp =00， 因 此 ALU 执行 加 法 。 有 效 地 址 将 存储 在 
ALUOut 寄存 器 中 为 下 一 步 使 用 做 准备 。 此 时 FSM 状态 如 图 7-33 所 示 ， 数 据 流 如 图 7-34 所 示 。 


SO: Fetch St: Decode 



















IorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSrc =0 
IR Write 
PCWrite 


Reset 












Op = LW 
or 
Op = SW 






S2: MemAdr 






ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 







PA 7-33 ”存储 器 地 址 计算 


如 果 指 令 为 Iw， 多 周期 处 理 器 必须 紧 接 着 从 存储 器 中 读 取 数据 并 将 数据 写 人 寄存 器 文件 
中 。 这 两 步 如 图 7-35 所 示 。 为 了 读 取 存储 器 ， 令 IorD =1 以 便 选 择 刚 刚 计 算 的 并 存 人 ALUOut 
中 的 存储 器 地 址 。 读 存储 器 地 址 ， 并 将 结果 在 步骤 S3 FFA Data 寄存 器 中 。 在 下 一 步 引 中 , 将 
Data 写 入 寄存 器 文件 。MemtoReg =1， 选 择 Data。RegDst =0， 从 指令 的 rt 字段 获得 目的 寄存 
器 地 址 。RegWrite 有 效 ， 执 行 写 操作 ， 执 行 lw 指令。 最 后 ，FSM 将 返回 到 初始 状态 S0， 取 出 
下 一 条 指令 。 对 于 这 些 和 随后 的 步 又， 请 读者 自行 完成 数据 流 图 。 
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图 7-34 存储 器 地 址 计算 时 的 数据 流 










SO: Fetch 













lorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSre =0 
IR Write 
PCWrite 


Reset 


Op = LW 
or 


S2: MemAdr Op = SW 




















ALUSrcA = | 
ALUSrcB = 10 
ALUOp = 00 


Op = LW 
S3: MemRead 


S4: Mem 
Writeback 





RegDst = 0 
MemtoReg = 1 
RegWrite 


图 7-35 Fiir 
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在 状态 S2 ， 如 果 指 令 为 sw， 从 寄存 器 文件 的 第 二 个 端口 读 取 的 数据 简单 地 写 人 存储 器 
中 。 在 状态 S3 ，IorD =1， 选择 S2 中 计算 的 并 保存 在 ALUOut 中 的 地 址 。 将 MemWrite 将 设置 
为 有 效 以 便 写 存储 器 。 此 外 ，FSM 返回 到 状态 SO 以 便 取 出 下 一 条 指令 。 增 加 的 步骤 如 图 7-36 
PIT AR o 











S0: Fetch S1: Decode 







lorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSre =0 
IRWrite 
PCWrite 


Reset 


S2: MemA dr 
















ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 


Op = LW 


S5: MemWrite 
S3: MemRead 


S4: Mem 
Writeback 





RegDst =0 
MemtoReg = 1 
RegWrite 


图 7-36 存储 器 写 
如 果 opcode 表示 R 类 型 指令 ， 那 么 多 周期 处 理 器 使 用 ALU 计算 结果 并 将 结果 写 人 寄存 
器 文件 。 图 7-37 显示 了 这 两 步 。 在 状态 SO, ， 通 过 选择 寄存 器 4 和 B( ALUSrcA =1, ALUSrcB = 
00) 并 根据 指令 的 funct 字段 执行 的 ALU 操作 来 执行 指令 。 对 于 R 类 型 指令 ，ALUOp = 10。 
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ALUResult 存储 器 在 ALUOut 中 。 在 状态 97, 将 ALUOut 写 人 寄存 器 文件 ，RegDst =1， 因 为 目 
的 寄存 器 由 指令 的 rd 字段 指定 。MemtoReg =0， 因 为 写 数 据 WD3 来 自 ALUOut。RegWrite 设置 
为 有 效 以 便 写 寄存 器 文件 。 


















SO: Fetch 







IorD = 0 
AluSrcA = 0 
ALUSrcB = 01 
ALUOp = 00 
PCSre =0 
IR Write 
PCWrite 


Reset 


Op = LW 
or 


re Op = R-type 
= SW 


y. 
$2: MemAdr S6: Execute 







ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 


ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 10 
























Op = LW S5: MemWrite S7: ALU 


S3: MemRead Writeback 





RegDst = | 
MemtoReg = 0 
RegWrite 


$4: Mem 
Writeback 





RegDst =0 
MemtoReg = 1 
RegWrite 


图 7-37 执行 R 类 型 操作 


对 于 beq 指令 ， 处 理 右 必须 计算 目的 地 址 ,并 比较 两 个 源 寄存 器 来 确定 是 否 发 生 转 移 。 
这 需要 使 用 ALU 两 次 ， 因 此 好 像 需要 两 个 新 的 状态 。 然 而 ， 我 们 注意 到 在 状态 S1 期 间 在 读 
寄存 器 时 ， 没 有 使 用 ALU。 处 理 器 也 可 以 在 此 时 使 用 ALU 通过 将 递增 的 PC(PC +4) 与 Sign- 
Imm x4 相 加 来 计算 目的 地 址 ， 如 图 7-38 所 示 。ALUSrcA =0， 选 择 递 增 的 PC; ALUSrcB = 
11， 选 择 SignImm x4; ALUOp =00， 完 成 加 法 。 目 的 地 址 存储 在 ALUOut 中 。 如 果 指 令 不 是 
beq， 计 算 的 地 址 将 不 在 随后 的 周期 中 使 用 ,但 是 这 个 计算 也 没有 坏处 。 在 状态 $8， 处 理 器 
通过 减法 并 判断 结果 是 否 为 0 来 比较 两 个 寄存 器 。 如 果 结 果 为 0， 则 处 理 器 将 转移 到 刚刚 计 
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算得 到 的 地 址 。ALUSrcA =1， 选 择 寄 存 器 4; ALUSrcB =00， 选 择 寄存 器 B; ALUOp =01, 
执行 减法 ; PCSre=1, M ALUOut 取出 目的 地 址 ; 如 果 ALU 结果 为 0， 则 Branch =1， 用 这 个 
地 址 更 新 PC ©. 






S0: Fetch S1: Decode 






























IorD = 0 












~ ALUSrcB = 01 ALUSrcA = 0 
ALUOp = 00 ALUSrcB = 11 
PCSre =0 ALUOp = 00 
IRWrite 
PCWrite 
Op = LW 
E Op = R-type 
Op = SW 
S2: MemAdr 


S6: Execute 








ALUSrcA = 1 


















ALUSrcA = 1 ALUSrcA = 1 ALUSrcB = 00 
ALUSrcB = 10 ALUSrcB = 00 ALUOp = 01 
ALUOp = 00 ALUOp = 10 PCSre = 1 


Branch 





Op = LW S5; MemWrite S7: ALU 


















S3: MemRead Writeback 
lorD = 1 Reape = 1 
m MemtoReg = 0 
MemWrite RegWrite 
S4: Mem 
Writeback 





RegDst = 0 
MemtoReg = 1 
RegWrite 


图 7-38 分支 指 令 


将 上 述 这 些 步骤 合并 在 一 起 ， 图 7-39 显示 了 多 周期 处 理 需 的 完整 的 主 控制 部 状态 转换 图 。 
利用 第 3 章 所 述 的 技术 ， 将 上 述 转换 图 转换 为 硬件 是 比较 直观 的 ， 但 工作 量 比较 大 。 然 而 比较 
好 的 是 ， 使 用 第 4 章 所 述 的 技术 用 硬件 描述 语言 对 FSM 编码 和 综合 。 


O ”这 里 我 们 看 到 为 什么 需要 PCSre 复 用 器 从 ALUResult( 在 状态 SO) BK ALUOut( 在 状态 S8 ) 选择 PC’. 
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SO: Fetch Si: Decode 













lorD = 0 
AluSrcA = 0 


















Reset ALUSrcA = 0 


ALUSrcB = 01 
ALUOp = 00 ALUSrcB = 11 
PCSre =0 ALUOp = 00 


IRWrite 
PCWrite 


Op = LW 


or 


S2; MemAdr Op = SW 


Op = R-type 


S6: Execute 











ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 01 

PCSre = 1 
Branch 












ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 


ALUSrcA = | 
ALUSrcB = 00 
ALUOp = 10 





















Op = LW 
$3: MemRead 


S5: MemWrite S7: ALU 
Writeback 


RegDst = | 
MemtoReg =0 
Reg Write 






lorD= 1 
MemWrite 





S4: Mem 
Writeback 





RegDst = 0 
MemtoReg = 1 
RegWrite 


图 7-39 完整 的 多 周期 控制 FSM 


7.4.3 更 多 指令 


与 7.3.3 节 中 对 单 周 期 处 理 器 所 做 的 工作 一 样 ， 我 们 现在 将 扩展 多 周期 处 理 器 以 便 支持 
addi 和 j 指令 。 下 面 的 两 个 例子 说 明了 支持 新 指令 的 通用 设计 过 程 。 

addi 指令 

修改 多 周期 处 理 器 以 便 支 持 addi 指令 。 

解 : 数据 路 径 已 经 提供 了 将 寄存 器 与 立即 数 相 加 的 能 力 ， 因 此 我 们 所 需要 做 的 就 是 为 ad- 
di 指令 给 主 控制 器 FSM 增加 一 个 新 的 状态 ， 如 图 7-40 所 示 。 这 些 状态 类 似 于 R 类 型 指令 的 状 
态 。 在 状态 S9， 寄 存 器 4 与 SignImm 相 加 (ALUSrcA =1，ALUSrcB =10，ALUOp =00) ， 其 结果 
ALUResult 存储 在 ALUOut。 在 状态 SIO, 将 ALUOut 写 和 指令 的 rt 字段 指定 的 寄存 器 中 
(RegDst =0，MemtoReg =0，RegWrite 为 有 效 ) 。 精 明 的 读者 可 能 会 发 现 S2 A S9 是 相同 的 ， 可 
以 合并 为 一 个 状态 。 













S0: Fetch 






ALUSrcB = 11 
ALUOp = 00 


S2: MemAdr S6: Execute 






ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 01 
PCSre = 1 
Branch 




















ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 


ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 10 


ALUSrcA = | 
ALUSrcB = 10 
ALUOp = 00 









Op = LW 
S3: MemRead 


S5: MemWrite S7: ALU 
Writeback 


S10: ADDI 
Writeback 





























RegDst = | 
MemtoReg = 0 
RegWrite 


RegDst = 0 
MemtoReg = 0 
Reg Write 






IorD= 1 
MemWrite 






S4: Mem 
Writeback 








RegDst = 0 
MemtoReg = 1 
Reg Write 


图 7-40 addi 指令 的 主 控制 器 状态 4 


j 指令 

修改 多 周期 处 理 器 以 便 支持 j 指令 。 

解 : 首先 ， 我 们 必须 修改 数据 路 径 ， 为 j 指令 计算 下 一 个 PC 值 。 然 后 ， 我 们 给 主 控制 器 
增加 一 个 新 的 状态 来 处 理 这 条 指令 。 

图 7-41 显示 了 扩展 的 数据 路 径 。 跳 转 目 的 地 址 由 指令 的 26 位 addr 字段 左 移 2 位 得 到 ， 
接着 预先 设计 已 经 递增 的 PC 的 最 高 4 位。 扩展 PCSre 复 用 器 将 此 地 址 作为 第 三 个 输入 。 


PCEn 
IorD MemWrite IRWrite RegDst MemioReg RegWrite ALUSrcA ALUSreB,, ALUControl,,, Branch PC Write] PCSre1:0 





7-41 支持 j 指令 的 扩展 的 多 周期 MIPS 数据 路 径 
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图 7-42 给 出 了 扩展 的 主 控制 器 。 新 状态 S11 简单 地 选择 PC' 作 为 PCJump 的 值 (PCSrc = 
10), 5A PC, WA, W S0 和 S8 PCSre 选择 信号 也 扩展 为 2 位 。 












S0: Fetch 

















Reset ALUSrcA =0 
ALUSrcB = 11 PCSre = 10 
ALUOp = 00 PCWrite 
$2: MemAdr = 


S6: Execute 







ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 01 
PCSre = 01 
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ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 


ALUSrcA = 1 
ALUSrcB = 00 
ALUOp = 10 


ALUSrcA = 1 
ALUSrcB = 10 
ALUOp = 00 














Op = LW 
S3: MemRead 










S5: Mem Write S7: ALU 
Writeback 


S10: ADDI 
Writeback 


















RegDst = 1 
MemtoReg = 0 
RegWrite 


RegDst =0 
MemtoReg =0 
RegWrite 





S4: Mem 
Writeback 








RegDst =0 
MemtoReg = 1 
RegWrite 
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7.4.4 性 能 分 析 


指令 的 执行 时 间 依 赖 于 它 使 用 的 周期 数 和 周期 时 间 。 单 周期 处 理 器 在 一 个 周期 内 执行 所 有 
的 指令 ， 而 多 周期 处 理 器 针对 不 同 的 指令 使 用 不 同 的 周期 数 。 然 而 ， 多 周期 处 理 器 在 一 个 周期 
中 的 工作 比较 少 ， 因 此 周期 时 间 将 比较 短 。 

对 于 bea Aj 指令 多 周期 处 理 器 需要 3 个 周期 ， 对 于 sw. addi 和 R 类 型 指令 需要 4 个 周 
期 ， 对 于 lw 指令 需要 5 个 周期 。CPI 取决 于 所 使 用 指令 的 相对 频 度 。 

多 周期 处 理 器 的 CPI 

SPECINT2000 基准 测试 程序 包含 了 大 约 25% 的 存储 器 装 人 指令 ，10% 的 存储 器 存储 指令 ， 
11% 的 分 支 指令 ， 2% 的 跳 转 指 令 和 52% 的 R 类 型 指令 S。 确 定 此 基准 程序 的 CPI. 

解 : 平均 CPI 是 每 条 指令 的 CPI 值 乘 以 使 用 该 指令 的 时 间 所 占 的 比例 之 和 。 对 于 这 个 基 
准 测试 程序 ， 平均 CPI= (0.11 +0.02)x(3)+(0.52+0.10)x(4) +(0.25) x (5) =4.12。 


名 “数据 来 源 于 Patterson 和 Hennessy 所 著 的 《Computer Organization and Design》，the Edition, Morgan Kaufmann, 
2011. 
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这 优 于 CPI =5 的 最 坏 情 况 ， 在 所 有 指令 都 需要 相同 运行 时 间 的 情况 下 ， 其 CPI 均 处 于 此 最 
坏 情 况 。 < 

在 我 们 设计 的 多 周期 处 理 器 中 ， 每 个 周期 包含 一 个 ALU RE, Fei a V Tel BY BF FE a CE 
访问 。 我 们 假设 寄存 器 文件 比 存储 器 快 ， 而 且 写 存储 器 比 读 存 储 器 快 。 考 察 数 据 路 径 可 以 发 现 
两 条 可 能 限制 周期 时 间 的 关键 路 径 : 

T, tg PF tice, Vmax (Egy F bust mem) F 

这 些 时 间 的 数值 结果 将 取决 于 特定 的 实现 技术 。 

处 理 器 性 能 比较 

Ben Bitdiddle 正在 考虑 是 否 应 该 使 用 多 周期 处 理 器 来 代替 单 周 期 处 理 器 。 对 这 两 个 设计 ， 
他 计划 使 用 65nm CMOS 工艺 实现 ， 其 延迟 由 表 7-6 给 出 。 请 帮助 他 比较 每 个 处 理 器 执行 
SPECINT2000 基准 测试 程 1000 亿 条 指令 的 执行 时 间 ( 人 参见 例 7.7) 。 

解 : 根据 式 (7-4) ， 多 周期 处 理 器 的 周期 时 间 为 T。=30 +25 +250 +20 =325ps。 使 用 例 
7.7 的 结果 ，CPI 为 4.2， 因 此 总 的 执行 时 间 为 了 =(100 x10 条 指令 ) x (4. 12 周期/ 指令) x 
(325 x 10°" #b/ FAH) =133. 9 秒 。 根 据 例 7.4， 单 周期 处 理 器 的 周期 时 间 为 7, =925ps，CPI 为 
1 ， 因 此 总 的 执行 时 间 为 92. 5 秒 。 

设计 多 周期 处 理 器 的 一 个 最 初 动机 是 避免 所 有 的 指令 都 按照 最 慢 指 令 的 速度 执行 。 不 幸 
的 是 ， 这 个 例子 表明 在 给 定 CPI 和 电路 元 件 延 迟 的 情况 下 ， 多 周期 处 理 器 的 速度 比 单 周 期 处 
理 器 慢 。 最 根本 的 问题 是 即使 最 慢 的 指令 lw 被 分 成 了 5 个 步骤 执行 ， 但 多 周期 处 理 器 的 周 
期 时 间 也 没有 提高 5 倍 。 一 部 分 原因 是 ， 并 不 是 所 有 步骤 都 具有 相同 的 长 度 ; 另 一 部 分 原因 
是 ， 每 个 步骤 必须 增加 寄存 器 clk-to-Q 的 50ps 的 序列 开销 和 建立 时 间 ， 而 不 只 是 针对 整个 


(7-4) 


setup 


指令 一 次 。 一 般 而 言 ， 工 程 师 必 须知 道 很 难 利用 某 些 计算 比 其 他 计算 快 的 事实 ， 除 非 差 别 


很 大 。 
与 单 周 期 处 理 器 相 比 ， 多 周期 处 理 器 似乎 更 便宜 ， 因 为 它 减少 了 两 个 加 法 器 ， 并 将 指令 和 存 
储 器 和 数据 存储 器 合并 为 一 个 单元 。 然 而 ， 它 需要 5 个 非 体系 结构 寄存 器 和 更 多 的 复 用 句 。 本 
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3.6 节 介 绍 的 流水 线 技术 是 提高 数字 系统 吞吐 量 的 有 效 手 段 。 通 过 将 单 周 期 处 理 器 分 解 
成 5 个 流水 线 阶段 来 构成 流水 线 处 理 器 。 因 此 ， 可 以 在 每 阶段 流水 线 中 同时 执行 5 条 指令 。 
由 于 每 阶段 仅 有 整个 逻辑 的 1/5， 所 以 时 钟 频率 几乎 可 以 提高 5 倍 。 因 此 ， 虽 然 每 条 指令 的 
延迟 并 未 改变 ,但 理想 情况 下 吞吐 量 可 以 提高 5 倍 。 微 处 理 器 每 秒 执行 上 百 万 其 至 数 十 亿 条 
指令 ， 所 以 吞吐 量 比 延迟 更 重要 。 流 水 线 引 入 了 一 些 开 销 ， 因 此 吞吐 量 不 能 达到 理想 要 求 
的 那么 高 ， 但 是 流水 线 依 然 有 小 成 本 的 强大 优势 ， 所 有 现代 高 性 能 微 处 理 器 都 使 用 流水 线 
技术 。 

读 / 写 存储 器 和 寄存 器 文件 、 使 用 ALU 通常 构成 处 理 器 中 的 最 大 的 延迟 。 我 们 选择 5 个 流 
水 线 阶段 ， 这 样 每 一 个 阶段 只 完成 一 个 慢 操 作 。 具 体 地 ， 我 们 称 这 5 个 阶段 为 : 取 指 令 
(Fetch) 、 译 码 (Decode) 、 执 行 (Execute) 、 存 储 器 (Memory) 和 写 回 (Writeback ) 。 它 们 类 似 于 多 
周期 处 理 器 中 执行 lw 指令 的 5 个 步骤 。 在 取 指 阶段 ， 处 理 器 从 指令 存储 器 中 读 取 指令 。 在 译 
码 阶段 ， 处 理 器 从 寄存 器 文件 中 读 取 源 操作 数 并 对 指令 译 码 以 便 产 生 控制 信号 。 在 执行 阶段 ， 
处 理 器 使 用 ALU 执行 计算 。 在 存储 器 阶段 ， 处 理 器 读 或 写 数据 存储 器 。 最 后 ,在 写 回 阶段 ， 
如 果 需 要 ， 处 理 器 将 结果 写 回 到 寄存 顺 文 件 。 

图 7-43 显示 了 比较 单 周期 处 理 器 与 流水 线 处 理 器 的 时 序 图 。 时 间 为 水 平 轴 ， 指 令 为 垂直 
轴 。 时 序 图 采用 了 表 7-6 的 逻辑 元 件 延 迟 ， 但 是 忽略 了 复 用 器 和 寄存 器 的 延迟 。 在 单 周 期 处 理 
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器 中 ， 如 图 7-43a 所 示 ， 第 一 条 指令 从 时 间 0 开始 读 存储 器 ; 下 一 步 ， 操 作 数 从 寄存 器 文件 中 
读 出 ; 接着 ALU 执行 必要 计算 。 最 后 ， 访 问 数据 存 储 器 ， 将 结果 在 950ps 后 写 回 到 寄存 器 文 
件 。 第 二 条 指令 在 第 一 条 指令 结束 后 开始 执行 。 因 此 ， 在 此 时 序 图 中 ， 单 周期 处 理 器 的 指令 延 
迟 为 250 +150 +200 +250 +100 =950ps， 而 且 吞吐 量 为 每 9$0ps 执行 1 条 指令 (每 秒 执 行 1. 05 x 
10 条 指令 )。 

在 图 7-43b 的 流水 线 微 处 理 器 中 ， 流水线 阶段 的 长 度 由 最 慢 阶 段 (这 里 为 取 指 或 存储 器 访 
问 ) 设 置 为 230ps。 在 时 间 0， 第 一 条 指令 从 存储 器 中 取出 。 在 250ps 时 ， 第 一 条 指令 进入 译 码 
阶段 ， 并 开始 取 第 二 条 指令 。 在 500ps 时 ， 第 一 条 指令 执行 ， 第 二 条 指令 进入 译 码 阶段 ， 并 取 
出 第 三 条 指令 。 以 此 类 推 ， 直 至 所 有 的 指令 完成 。 指 令 延 迟 为 5 x250 = 1250ps。 香 吐 量 为 每 
250ps 执行 一 条 指令 (每 秒 执行 4x10 条 指令 )。 由 于 流水 线 阶段 的 划分 不 能 完美 地 平均 分 配 所 
有 的 逻辑 ， 所 以 流水 线 处 理 器 的 延迟 将 比 单 周 期 处 理 器 长 一 些 。 类 似 地 ，5 阶段 流水 线 也 不 能 
anger ee see ne Ut 但 是 ， 其 吞吐 量 的 优势 是 非常 明显 的 。 
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b) 流水 线 处 理 器 
图 7-43 ”时 序 图 


图 7-44 中 给 出 了 流水 线 操作 的 一 个 抽象 视图 ， 其 中 每 阶段 都 采用 图 形 表示 。 每 阶段 流水 
线 由 它 的 主要 组 件 (指令 存储 器 (IM) 、 寄 存 器 文件 (RF) 读 、ALU 执行 、 数 据 存储 器 (DM ) 和 寄 
存 右 文件 写 回 ) 来 说 明 流 经 流水 线 的 指令 流 。 沿 着 每 一 行 读 ， 可 以 确定 特定 指令 在 每 一 阶段 中 
的 时 钟 周 。 例 如 ，sub 指令 在 周期 3 取 指 令 ， 在 周期 5 执行 。 沿 着 每 一 列 读 ， 可 以 确定 在 特定 
周期 不 同 流水 线 阶段 的 操作 。 例 如 ， 在 周期 6， 从 指令 存储 器 中 取出 or HES, 在 从 寄存 器 文 
件 中 读 出 $sl 时 ，ALU 正在 计算 St5 AND St6， 数 据 存储 器 空闲 ， 寄 存 器 文件 将 和 写 人 
$s3。 每 阶段 流水 线 用 阴影 表示 它们 正在 使 用 。 例 如 ， 数 据 存储 器 在 周期 4 由 lw 指令 使 用 ， 
在 周期 8 由 sw 指令 使 用 。 指 令 存 储 器 和 ALU 在 每 个 周期 都 使 用 。 除 了 sw 指令 外 ,每 条 指令 
都 写 寄存 吉文 件 。 在 流水 线 处 理 器 中 ， 在 一 个 周期 的 前 半 部 分 写 寄 存 器 文件 ， 在 后 半 部 分 读 寄 
存 器 文件 。 这 样 ， 数 据 可 以 在 一 个 周期 内 完成 写 人 和 读 取 。 

流水 线 系统 中 的 核心 问题 是 化 解 冲突 (Hazard)。 在 后 一 条 指令 需要 前 一 条 指令 的 计算 结 
果 ， 而 前 一 条 指令 还 没有 执行 完 时 就 会 发 生 冲 突 。 例 如 ， 如 果 图 7-44 中 add 指令 使 用 $82, 
而 不 是 St2 ， 将 可 能 发 生 冲 突 ， 因 为 在 add 指令 读 取 时 ， 还 没有 由 1w 指令 还 没有 将 结果 写 人 
寄存 器 $s2。 本 节 将 研究 重 定向 (Forwarding) 、 阻 塞 (Stall) 和 刷新 (Flush) 等 化 解 冲突 的 方法 。 
最 后 ， 本 节 将 再 次 对 考虑 了 时 序 开 销 和 冲突 影响 的 性 能 进行 分 析 。 
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图 7-44 操作 中 的 流水 线 抽象 表示 


流水 线 数据 路 径 是 由 流水 线 寄存 器 将 单 周 期 处 理 器 数据 路 径 划 分 为 5 个 阶段 。 图 7-45a 中 
给 出 了 扩展 单 周 期 处 理 髓 数据 路 径 给 流水 线 寄存 器 留 出 位 置 。 图 7-45b 则 显示 了 插入 4 个 流水 
线 寄存 器 将 数据 路 径 分 割 成 5 个 阶段 以 便 形成 流水 线 数据 路 径 。 阶 段 和 边界 用 灰色 表示 。 信 号 
后 面 增加 了 一 个 后 级 (F，D，,，E，M 和 W) 用 来 标识 它们 属于 哪个 阶段 。 
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图 7-45 单 周期 和 流水 线 数据 路 径 
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寄存 器 文件 比较 特殊 ， 因 为 它 在 译 码 阶段 读 取 ， 而 在 写 回 阶段 写 人 。 它 画 在 译 码 阶 段 ， 但 
是 在 写 回 阶段 写 人 地址 和 数据 。 这 个 反馈 带 来 的 流水 线 冲 突 问题 将 在 7.5.3 中 讨论 。 当 WD3 
言 号 稳定 时 ， 流 水 线 处 理 器 的 寄存 器 文件 在 CLK 的 下 降 沿 写 人 数据 。 

流水 线 中 一 个 细微 但 重要 的 问题 是 ， 与 特定 指令 相关 的 所 有 信号 都 必须 通过 流水 线 一 起 问 
前 传播 。 图 7-45b 中 有 一 个 与 这 个 问题 相关 的 错误 ， 你 能 发 现 它 吗 ? 

这 个 错误 在 写 回 阶段 的 寄存 器 文件 写 信 多 辑 。 数 据 值 来 自 ResultW ，ResultW 是 写 回 阶段 的 
信号 。 但 是 地 址 却 来 自 执行 阶段 的 信号 WriteRegE。 在 图 7-44 中 的 流水 线 图 中 ， 在 周期 5，1lw 
指令 的 结果 就 错误 地 写 和 人 $s4 寄存 器 中 ， 而 不 是 $s2 寄存 器 。 

图 7-46 给 出 了 正确 的 数据 路 径 。WriteReg 信和 号 现在 经 过 存储 器 和 写 回 阶段 沿 流 水 线 传递 ， 
因此 它 将 与 指令 的 其 他 部 分 保持 同步 。 在 写 回 阶段 WriteRegW 和 ResultW 一 起 传送 到 寄存 器 
文件 。 


SrcAE : 
2 sel : 
: r WriteDataE : 


: wD J|: 
WriteRegE,, |: i | WriteRegW,4o 


: 0 
Pe] 
‘sper <<) = | 


I 
PCPlus4E 





取 指 令 泽 码 : 执行 存储 器 | 写 回 
图 7-46 正确 的 流水 线 数据 路 径 


细心 的 读者 可 能 发 现 PC' 的 逻辑 也 有 问题 ， 因 为 它 与 取 指 阶段 或 存储 器 阶段 的 信号 (PCPlus4F 
和 PCBranchM ) 一 起 更 新 。 这 个 控制 冲突 将 在 7. 5. 3 节 中 修正 。 


7. 5.2 流水 线 控制 


流水 线 处 理 融 与 单 周 期 处 理 硕 使 用 相同 的 控制 信号 ， 因 此 它 也 可 以 使 用 相同 的 控制 单元 。 
控制 单元 在 译 码 阶段 检查 指令 的 opcode 和 funct 字段 ,产生 控制 信号 ， 如 7.3. 2 节 介 绍 的 。 
这 些 控制 信号 必须 与 数据 一 起 流 经 流水 线 ， 使 它们 与 指令 保持 同步 。 

寓 控 制 信号 的 整个 流水 线 处 理 顺 如 图 7-47 所 示 。 在 RegWrite 信号 反馈 回 寄存 器 文件 前 它 
必须 经 过 流水 线 进 入 写 回 阶段 ， 与 图 7-46 中 的 WriteReg 信号 一 样 。 


7.5.3 .冲突 

在 流水 线 系统 中 ， 多 条 指令 同时 执行 。 当 一 条 指令 依赖 于 还 没有 结束 的 另 一 条 指令 的 结果 
时 ， 将 发 生 冲 突 。 

寄存 器 文件 可 以 在 同一 个 周期 内 完成 读 和 写 。 假 设 写 操作 发 生 在 一 个 周期 的 前 半 部 分 ， 读 
操作 发 生 在 该 周期 的 后 半 部 分 ， 这 样 寄存 器 可 以 在 同一 个 周期 内 执行 写 人 和 读 出 而 不 产生 
冲突 。 

图 7-48 指出 当 一 条 指令 写 寄 存 器 $s0 且 后 一 条 指令 读 这 个 寄存 器 时 ， 将 产生 冲突 。 这 种 
冲突 称 为 写 后 读 ( Read After Write, RAW), add 指令 在 周期 5 的 前 半 部 分 将 结果 写 人 $s0 。 然 
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m, and 指令 需要 在 周期 3 读 $s0， 这 将 得 到 一 个 错误 的 值 。or 指令 在 周期 4 读 $s0, Eth 
将 得 到 错误 的 值 。sub 指令 在 周期 5 的 后 半 部 分 读 $s0 ， 可 以 得 到 正确 的 值 ， 因 为 正确 的 值 在 
周期 5 的 前 半 部 分 已 经 写 和 人。 后 续 指 令 也 可 以 获得 $s0 的 正确 值 。 这 个 图 显示 了 当前 一 条 指 
令 写 寄存 右上 且 后 续 两 条 指令 的 任何 一 条 读 这 个 寄存 器 时 流水 线 可 能 会 发 生 冲 突 。 如 果 不 做 特殊 
的 处 理 , 流水线 将 计算 错误 的 结果 。 
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图 7-48 说 明 冲 突 的 抽象 流水 线 图 


然而 ， 对 这 个 问题 做 进一步 的 分 析 可 以 发 现 ， 在 周期 3 由 ALU 计算 的 add 指令 的 和 ， 直 
到 在 周期 4 ALU (EHEH, and 指令 才 需 要 它 。 原 则 上 ， 我们 应 该 能 够 将 前 一 条 指令 的 结果 重 
定 问 给 后 一 条 指令 来 化 解 RAW 类 型 冲突 ， 而 不 降低 流水 线 的 性 能 。 在 本 节 后 面 讨论 的 情况 中 ， 
我 们 可 能 必须 阻塞 流水 线 来 暂停 后 续 指 令 的 执行 ， 为 前 面 指令 获得 计算 结果 赢得 时 间 。 无 论 何 
种 情况 ， 必 须 对 流水 线 进行 处 理 以 便 解 决 冲突 问题 ， 保 证 程序 运行 的 正确 性 。 

冲突 可 以 分 为 数据 冲突 和 控制 冲突 。 在 当 一 条 指令 试图 读 取 前 一 条 指令 还 未 写 回 的 寄存 器 
时 将 发 生 数 据 冲 突 。 在 取 指 令 时 还 未 确定 下 一 条 指令 应 取 的 地 址 时 将 发 生 控 制 冲 突 。 我 们 将 在 
本 节 的 后 面 为 流水 线 处 理 咒 增加 一 个 冲突 单元 以 便 发 现 和 正确 处 理 冲 突 ， 从 而 保证 处 理 器 能 正 
确 执行 程序 。 


260 第 7 人 章 


1. 使 用 重 定 向 解决 冲突 

有 些 数 据 冲 突 可 以 通过 将 存储 需 访 问 阶段 或 写 回 阶段 的 结果 重 定向 (forwarding ) BY F % 
( bypassing ) 到 执行 阶段 的 相关 指令 来 解决 。 这 需要 在 ALU 的 前 面 增加 复 用 器 以 便 选 择 来 目 寄 
存 器 文件 来 的 操作 数 ， 或 存储 器 阶段 或 写 回 级 阶段 的 结果 。 图 7-49 显示 了 基本 的 设计 原理 。 
在 周期 4， 将 $s0 寄存 器 从 and 指令 的 存储 器 阶段 重 定向 到 相关 and 指令 的 执行 阶段 。 在 周 
期 5, 将 $s0 从 add 指令 的 写 回 阶段 重 定向 到 相关 or 指令 的 执行 阶段 。 
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图 7-49 ”说明 重 定向 的 抽象 流水 线 示意 图 


当 执 行 阶段 中 的 指令 有 一 个 与 存储 器 阶段 或 写 回 阶段 中 的 目的 寄存 占 相 匹配 的 源 寄存 器 
时 ， 需 要 重 定向 。 图 7-50 修改 了 流水 线 处 理 器 来 文 持 重 定向 。 它 增加 了 了 冲突 检测 单元 和 两 个 
重 定 癌 复 用 器 。 冲 突 检 测 单元 接收 在 执行 阶段 中 指令 的 两 个 源 寄存 器 ， 以 及 在 存储 融和 写 回 阶 
段 中 指令 的 目的 寄存 器 ， 它 还 从 存储 器 阶段 和 写 回 阶段 接收 RegWrite 信号 以 便 明 确 是 否 要 写 目 
的 寄存 器 (例如 ，sw A beg 指令 不 需要 将 结果 写 入 寄存 右 文 件 ， 因 此 也 不 需要 重 定 问 结果 )。 
注意 RegWrite 信号 是 按 名 字 连 接 的 。 换 句 话 说， 为 了 保持 电路 图 清楚 不 再 将 控制 信号 用 长 线 从 
顶端 连接 到 低 端 的 冲突 部 件 ， 而 是 使 用 一 个 带 控 制 信号 名 的 短线 连接 。 

冲突 检测 单元 为 重 定向 复 用 器 计算 控制 信号 以 便 确 定 选择 来 自 寄 存 器 文件 的 操作 数 ， 还 是 
来 目 存 储 融 阶段 或 写 回 阶段 的 结果 。 如 果 某 阶段 将 写 目 的 寄存 硕 且 目的 寄存 船 匹 配 源 寄 存 郁 ， 
则 重 定向 该 级 阶段 结果 。 然 而 ， $0 硬 连 接 为 0， 因 此 它 不 需要 重 定 向 。 如 果 存 储 器 阶段 和 写 
回 阶段 同时 包含 匹配 的 目的 寄存 器 ， 则 存储 器 阶段 具有 更 高 的 优先 级 ， 因 为 它 包 含 了 更 新 的 执 
行 指令 的 结果 。 总 之 ， 针 对 SrcA 的 重 定 向 逻辑 功能 如 下 式 所 示 。 针 对 SrcB 的 重 定 问 逻 辑 (For- 
wardBE) 与 之 类 似 ， 除 了 它 检查 rt 寄存 器 不 检查 rs 寄存 器 外 。 

if ((rsE !=0) AND (rsE==WriteRegM) AND RegWriteM) then 

ForwardAE = 10 
else if ((rsE !=0) AND (rsE == WriteRegW) AND RegWriteW) then 
ForwardAE=01 

else ForwardAE = 00 

2. 使 用 阻塞 解决 冲突 

当 在 执行 阶段 计算 指令 结果 时 ,使 用 重 定向 解决 RAW 数据 冲突 就 足够 了 ， 因 为 它 的 结果 
可 以 重 定向 到 后 一 条 指令 的 执行 阶段 。 但 是 ，1w 指令 直到 存储 器 阶段 后 才能 完成 读数 据 ， 因 
此 它 的 结果 不 能 重 定向 到 下 一 条 指令 的 执行 阶段 。 我 们 说 lw 指令 有 两 个 周期 延迟 ， 因 为 相关 
指令 直到 两 个 周期 后 才能 使 用 它 的 结果 。 图 7-51 说 明了 这 个 问题 。1w 指令 在 周期 4 的 结尾 才 
从 存储 器 中 接收 数据 。 但 是 and 指令 周期 4 的 开始 时 就 需要 这 个 数据 作为 源 操作 数 。 使 用 重 定 
向 无 法 解决 这 种 冲突 。 
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图 7-51 说 明 lw 重 定向 问题 的 抽象 流水 线 图 


男 一 种 解决 方法 是 阻塞 流水 线 ， 将 操作 挂 起 直至 数据 有 效 时 。 图 7-52 显示 了 在 译 码 阶段 
阻塞 相关 指令 (and) 。 该 指令 (and) 在 周期 3 进入 译 码 阶段 ， 并 一 直 阻 塞 直 到 周期 4。 在 此 过 
程 中 ， 后 续 的 or 指令 必须 也 保持 在 取 指 阶段 ， 因 为 译 码 阶段 已 经 满 了 。 
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sub $t2, $s0, $s5 IM | [reals [3 r 
图 7-52 通过 阻塞 方式 解决 冲突 的 抽象 流水 线 图 


在 周期 5， 结 果 从 lw 的 写 回 阶段 重 定向 到 and 指令 的 执行 阶段 。 在 周期 6，or 指令 的 源 
$s0 寄存 器 直接 从 寄存 器 文件 中 读 ， 而 不 需要 重 定向 。 

注意 执行 阶段 在 周期 4 没有 使 用 。 与 之 类 似 ， 存储器 阶段 和 写 回 阶段 也 分 别 在 周期 5 和 周 
期 6 中 没有 使 用 。 这 种 党 着 流水 线 传播 的 未 使 用 阶段 称 为 气泡 (bubble) ， 它 的 行为 类 似 于 nop 
指令 。 气 泡 的 产生 是 由 在 译 码 阶段 阻塞 时 对 执行 阶段 产生 无 效 的 控制 信号 ， 使 得 气泡 不 执行 操 
作 ， 也 不 修改 体系 结构 状态 。 

总 之 ， 可 以 通过 禁止 流水 线 寄存 器 来 阻塞 某 个 阶段 ， 使 得 寄存 器 的 内 容 不 改变 。 当 某 阶段 流水 
线 被 阻塞 时 ， 所 有 前 面 的 各 阶段 也 都 应 该 被 阻塞 ， 这 样 后 续 的 指令 就 不 会 丢失 。 在 阻塞 阶段 后 的 流 
水 线 寄 存 需 必须 清除 ， 防 止 错误 信息 传播 重 定 向 。 阻 塞 降低 性 能 ， 因 此 它们 只 有 在 必需 时 才能 使 用 。 

图 7-53 修改 了 流水 线 处 理 器 ， 为 lw 指令 的 数据 相关 性 增加 阻塞 功能 。 冲 突 单元 检查 执行 
阶段 中 的 指令 。 如 果 它 是 lw 指令 且 其 目的 寄存 器 rtE 匹配 译 码 阶段 中 指令 的 任意 一 个 源 操作 
数 (rsD 或 rtD)， 则 指令 必须 在 译 码 阶段 阻塞 直至 源 操作 数 准备 好 。 

通过 给 取 指 阶段 和 译 码 阶段 流水 线 寄存 器 增加 使 能 输入 (EN) 以 及 给 执行 阶段 流水 线 寄存 
右 增 加 同步 复位 /清除 (CLR) 来 支持 阻 寨 。 当 lw 阻塞 出 现时 ，StalD 和 StallF 信号 有 效 ， 迫 使 
译 码 阶 段 和 取 指 阶段 流水 线 寄存 器 保持 原来 的 值 。 FlushE 也 有 效 ， 清 除 执 行 阶段 流水 线 寄存 器 
的 内 容 ， 产 生气 泡 ”。 





四 DM = i 一 RF 


O 严格 地 讲 ， 只 有 寄存 器 名 (RsE、RtE 和 RdE ) 以 及 可 能 改变 存储 器 或 体系 结构 状态 的 控制 信号 ( Reg Write , 
MemWrite 和 Branch) 需要 清除 。 一 旦 这 些 信号 被 清除 了 ,气泡 可 能 包含 不 产生 作用 的 随机 数据 。 
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对 于 lw 指令 ，MemtoReg 信号 将 变 为 有 效 。 因 此 ， 计 算 阻 塞 和 刷新 的 逻辑 为 : 


lwstall=((rsD==rtE) OR (rtD==rtE)) AND MemtoRegE 
StallF =Stal1D=FlushE=I1wstal | 


3. 解决 控制 冲突 

beq 指令 将 产生 控制 冲突 ， 因 为 在 取 下 一 条 指令 时 分 支 是 否 发 生还 尚未 确定 ， 所 以 流水 线 
处 理 器 不 知道 取 哪 条 指令 。 

处 理 控制 冲突 的 一 种 机 制 是 阻塞 流水 线 直 到 确定 分 支 是 否 发 生 为 止 ( 计 算出 PCSre) 。 因 为 
确定 分 支 是 在 存储 器 阶段 完成 的 ， 所 以 流水 线 将 在 每 个 分 支 阻塞 3 个 周期 。 这 将 严重 降低 系统 
的 性 能 。 

另 一 种 解决 方法 是 预测 分 支 是 否 发 生 ， 并 基于 该 预测 来 执行 指令 。 一 且 确 定 发 生 分 文 ， 如 
果 预 测 是 错误 的 ， 则 处 理 器 将 抛弃 这 条 错误 的 指令 。 尤 其 是 ， 假 设 我 们 预测 所 有 的 分 支 都 不 会 
发 生 而 只 是 简单 地 按 顺 序 执行 程序 。 如 果 分 支 的 确 发 生 了 ， 则 分 支 指令 后 的 3 条 指令 将 通过 清 
除 这 些 指 令 的 流水 线 寄 存 器 来 刷新 (抛弃 ) 。 这 些 浪 费 的 指令 周期 称 为 分 支 错误 预测 代价 
(branch misprediction penalty ) 。 

图 7-54 显示 了 这 样 的 机 制 ， 其 中 从 地 址 20 ~ 64 的 分 支 将 发 生 。 这 个 分 支 决策 在 周期 4 中 
确定 ， 此 时 and, or 和 sub 指令 (地 址 分 别 为 24、28 和 2C) 已 经 取出 。 这 些 指令 必须 刷新 ， 
并 且 在 周期 5 从 地 址 64 取出 sit 指令 。 这 已 经 有 所 改进 ， 但 是 当 分 支 发 生 刷新 很 多 指令 仍然 
降低 了 性 能 。 


1 2 3 4 5 6 7 8 9 
时 间 (周期 ) 





20 beq Sti, $t2, 40 区 人 kika e 


keH He 
Malum heH He 














24 and $t0, $s0, $sl 





28 or Sti, Fen $00 i eee} Her oe 
T pi, mee they HE 

30 

64 slt $t3, $s2, $83 meee pe ie 


图 7-54 ” 当 分 支 发生 时 刷新 操作 的 抽象 流水 线 图 


如 果 能 尽早 确定 是 否 发 生 分 支 可 以 减少 分 支 错 误 预 测 代价 。 确 定 分 支 仅 需 要 比较 两 个 寄存 
器 是 否 相 等 。 使 用 一 个 专门 的 相等 比较 器 比 执行 减法 和 0 检测 快 很 多 。 如 果 比 较 融 足够 快 ， 可 
以 将 其 放 到 译 码 阶段 ， 这 样 从 寄存 器 文件 中 读 操 作 数 并 比较 ， 就 可 以 在 译 码 阶段 结束 时 确定 下 
~ 

图 7-55 显示 了 在 周期 2 尽早 完成 分 支 判 断 的 流水 线 操作 。 在 周期 3， 刷新 and 指令 且 取 出 
sit 指令 。 此 时 ,分 支 错误 预测 代价 已 经 从 3 条 指令 减少 到 1 条 。 

图 7-56 修改 了 流水 线 处 理 器 以 便 尽 早 完成 分 支 判断 并 处 理 控制 冲突 。 在 译 码 级 增加 了 
一 个 相等 比较 器 ， 而 且 PCSre 与 门 也 移 到 前 面 ， 这 样 PCSre 就 在 译 码 阶 段 确定 而 不 是 在 存储 
器 阶段 。PCBranch 加 法 器 也 必须 移 到 译 码 阶段 ， 这 样 可 以 及 时 计算 目的 地 址 。 需 要 增加 连 
接 PCSreD 的 同步 清除 输入 ( CLR ) 到 流水 线 寄存 器 ， 从 而 当 分 支 发 生 时 可 以 清除 不 正确 的 预 
取 指 令 。 
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图 7-55 尽早 确定 分 支 的 抽象 流水 线 图 


不 幸 的 是 ， 提 前 确定 分 支 的 硬件 会 产生 新 的 RAW 数据 冲突 。 特 别 是 ， 如 果 分 支 指令 的 一 
个 源 操 作 数 由 前 一 条 指令 计算 得 到 且 还 没有 写 大 寄存 器 文件 ， 分 支 指令 将 从 寄存 器 文件 中 读 取 
错误 的 操作 数值 。 我 们 可 以 采用 前 面 所 介绍 的 方法 来 解决 数据 冲突 (如 果 数 据 有 效 则 进行 转发 ， 
或 者 阻塞 流水 线 直 至 数据 准备 好 ) 。 

图 7-57 显示 了 对 流水 线 处 理 器 的 修改 以 便 解 决 在 译 码 阶段 的 数据 相关 性 。 如 采 结 果 在 写 
回 阶段 ， 它 将 在 前 半 周 期 写 人 寄存 器 ， 而 在 后 半 周 期 进行 读 操 作 ， 所 以 此 时 不 存在 冲突 。 如 果 
ALU 指令 的 结果 在 存储 器 阶段 ， 可 以 将 它 通 两 个 新 的 复 用 需 重 定 回 到 相等 比较 右 。 如 果 ALU 
指令 的 结果 在 执行 阶段 或 者 1w 指令 的 结果 在 存储 器 阶段 ， 则 流水 线 必须 在 译 码 阶段 阻塞 直至 
结果 准备 好 。 


译 码 阶段 重 定 癌 迎 辑 如 下 式 给 出 。 
ForwardAD = (rsD != 0) AND (rsD == WriteRegM) AND RegWriteM 
ForwardBD = (rtD != 0) AND (rtD == WriteRegM) AND RegWriteM 


DERMEN FRR AeA AU LE PES BT Be FE DO SCAT. WFR Ot SHAS AY 
源 寄 存 器 依赖 于 处 于 执行 阶段 的 ALU TRS, BC HORS FEA aE TBH) lw ta, Mb as RH 
塞 直至 源 操作 数 准备 好 。 


branchstall = 
BranchD AND RegWriteE AND (WriteRegE == rsD OR WriteRegE == rtD) 
OR 
BranchD AND MemtoRegM AND (WriteRegM == rsD OR WriteRegM == rtD) 
现在 处 理 器 阻塞 可 以 会 由 于 装 和 人 或 分 支 冲 突 : 


StallF = Stal1D = FlushE = Iwstall OR branchstal] 


4. 冲突 总 结 

总 之 ， 当 一 条 指令 依赖 于 另 一 条 指令 的 结果 ， 而 此 结果 还 未 写 人 寄存 器 文件 时 ， 将 产生 
RAW 数据 冲突 。 解 决 数据 冲突 的 方法 有 两 种 : 如 果 结 果 足 够 快 地 计算 出 来 ， 则 可 以 采用 重 定 
向 方法 ; 否则 阻塞 流水 线 直 至 结果 可 以 使 用 。 在 必须 取 下 一 条 指令 时 还 不 能 确定 应 该 取 哪 条 指 
令 时 将 发 生 控 制 冲突 。 控 制 冲突 可 以 通过 下 述 方法 解决 : 预测 应 该 取 哪 条 指令 ， 如 果 后 来 确定 
预测 是 错误 的 则 刷新 流水 线 。 尽 量 将 分 支 确定 过 程 提前 可 以 减少 错误 预测 时 刷新 的 指令 数目 。 
你 可 以 发 现 ， 设 计 流 水 线 处 理 器 的 主要 挑战 是 ， 理 解 指令 之 间 所 有 可 能 的 相互 关系 并 发 现 可 能 
存在 的 所 有 冲突 。 图 7-58 显示 了 可 以 处 理 所 有 冲突 的 完整 的 流水 线 处 理 器 。 
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7.5.4 更 多 指令 


在 流水 线 处 理 器 中 增加 新 指令 非常 类 似 于 在 单 周 期 处 理 器 中 增加 新 指令 。 然 而 ， 必 须 检 测 
和 解决 新 指令 所 带 来 的 冲突 。 

尤其 是 ， 在 流水 线 处 理 器 上 增加 addi 指令 和 j 指令 需要 扩展 控制 器 ， 如 7.3.3 节 中 所 
述 ， 给 分 支 复 用 器 后 面 的 数据 路 径 增 加 一 个 跳 转 复 用 器 。 类 似 于 分 文 ， 跳 转 也 在 译 码 阶段 发 
生 ， 所 以 在 取 指 阶段 的 后 续 指 令 也 必须 刷新 。 这 个 刷新 逻辑 的 设计 留 作 习题 7. 35 。 


7.5.5 性 能 分 析 


理想 的 流水 线 处 理 器 的 CPI 应 该 为 1， 因 为 每 个 周期 都 发 布 一 条 指令 。 然 而 阻塞 或 刷新 浪 
费 一 个 周期 ， 所 以 CPI 将 稍 高 一 些 ， 并 与 执行 的 具体 程序 密切 相关 。 
流水 线 处 理 器 CPI 


例 7.7 考虑 的 SPECINT2000 基准 测试 程序 包含 了 大 约 25% 的 装 人 指令 、10% 的 存储 指令 、 
11% 的 分 支 指令 ， 2% 的 跳 转 指令 和 52% 的 R 类 型 指令 。 假 设 40% 的 装 和 人 指令 后 面 的 指令 需要 
使 用 其 结果 ， 需 要 阻塞 ， 而且 1/4 的 分 支 预测 错误 ， 需 要 刷新 。 假 设 转移 指令 需要 总 是 刷新 后 
续 指 令 。 忽 略 其 他 冲突 。 请 计算 流水 线 处 理 右 的 平均 CPI。 

解 : 平均 CPI 是 每 条 指令 的 CPI 乘 以 其 所 占 时 间 的 比例 。 装 人 指令 当 不 存在 相关 性 时 需要 
一 个 周期 ， 在 有 相关 性 时 需要 两 个 周期 ， 因 此 其 CPL 为 0.6 x1+0.4x2=1.4。 分支 指 令 在 预 
测 正确 时 需要 一 个 周期 ， 在 预测 错误 时 需要 两 个 周期 ， 因 此 其 CPI 为 0.75 x1 +0.25 x2 = 
1.25。 跳 转 指 令 的 CPI 总 是 为 2。 其 他 指令 的 CPI 均 为 1。 因此， 对 于 此 基准 测试 程序 ， 平 均 
CPI 为 0.25 x1.4+0.1 x1 +0.11 x1.25 +0:52x1=1.15, 

我 们 可 以 通过 考虑 图 7-58 中 显示 的 5 个 流水 线 阶段 的 每 个 阶段 的 关键 路 径 来 确定 周期 时 
间 。 寄 存 天 文件 在 写 回 周期 的 前 半 部 分 写 人 ， 在 译 码 周期 中 的 后 半 部 分 读 出 。 因 此 ， 译 码 阶段 
和 写 回 阶段 的 周期 时 间 是 完成 半 个 周期 工作 所 需 时 间 的 2 倍 。 


te P Bua + bee 取 指 令 
2(trrread 十 am + leg + banp + bux + tep) | 译 码 
T, = max| to + bau tims + Cary + tac, 执行 (7-5) 
tan © hale hee 储 器 
(beg + bmx + Rewrite ) & 回 4 


处 理 器 性 能 比较 


Ben Bitddle 需要 将 流水 线 处 理 器 的 性 能 与 例 7. 8 中 的 单 周 期 处 理 器 和 多 周期 处 理 器 的 性 能 
进行 比较 。 大 部 分 的 逻辑 延迟 在 表 7-6 中 给 出 。 其 他 元 件 包 括 : 相等 比较 天 的 延迟 为 40ps， 与 
门 为 15ps， 寄 存 器 文件 写 为 100ps， 存 储 器 写 为 220ps。 请 帮助 Ben 比较 在 每 种 处 理 器 上 执行 
SPECINT2000 基准 测试 程序 的 10 条 指令 的 时 间 。 

解 : 根据 式 (7-5) ， 流 水 线 处 理 器 的 周期 时 间 为 了, = max[ 30 +250 +20, 2(150 +25 +40 + 
15 +25 +20), 30 +25 +25 +200 +20, 30 +220 +20, 2(30 +25 +100) | =5$0ps。 根 据 式 (7-1) ， 总 
的 执行 时 间 为 T, =(10 条 指令 ) x (1. 15 周期 /指令 ) x (550 x10”) =63.3 秒 。 将 它 与 
单 周 期 处 理 器 的 92. 5 秒 和 多 周期 处 理 器 的 133. 9 秒 比 较 。 

流水 线 处 理 器 明显 比 其 他 处 理 器 更 快 。 然 而 ， 它 相对 于 单 周 期 处 理 器 的 优势 不 是 理想 的 5 
阶 流水 线 所 带 来 的 5 倍加 速 比 。 流 水 线 冲突 导致 了 比较 小 的 CPI 开销 。 更 为 显著 的 是 ， 寄 存 需 
的 时 序 开销 (包括 clk-to-Q 和 建立 时 间 ) 对 每 个 流水 线 阶段 都 有 影响 ， 而 不 只 是 整个 数据 路 径 。 
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时 序 开 销 限 制 了 可 能 从 流水 线 得 到 的 益处 。 
细心 的 读者 可 能 已 经 ， 发 现 译 码 阶段 明显 比 其 他 阶段 都 慢 ， 因 为 寄存 器 读 、 分 支 比较 都 需 
要 在 半 个 周期 内 完成 。 也 许 将 分 支 比 较 放 到 译 码 阶段 不 是 一 个 好 的 主意 。 如 果 在 执行 阶段 完成 
分 支 判 断 ， 则 CPI 有 少量 增加 ， 因 为 错误 预测 刷新 2 条 指令 ， 但 周期 时 间 将 显著 减少 ， 提 升 了 
总 的 加 速 比 。 <4 
流水 线 处 理 器 的 硬件 需求 类 似 与 单 周 期 处 理 器 ， 但 它 增加 大 量 的 流水 线 寄 存 器 和 用 于 解决 
冲突 的 复 用 器 和 控制 逻辑 。 


7.6 硬件 描述 语言 表示 ” 

本 节 介 绍 单 周 期 MIPS 处 理 器 的 硬件 描述 语言 代码 ， 该 处 理 器 可 以 支持 本 章 所 介绍 的 所 有 
指令 ， 包 括 addi Mj 指令 。 对 于 中 等 复杂 程度 的 系统 ， 这 些 代 码 可 以 作为 一 个 良好 的 编码 练 
习 。 对 于 多 周期 处 理 右 和 流水 线 处 理 器 的 硬件 描述 语言 代码 留 作 习 题 7.25 和 习题 7.40。 

在 本 节 中 ， 指 令 和 数据 存储 器 与 主 处 理 器 分 离 ， 通 过 地 址 和 数据 总 线 连接 。 这 样 将 更 加 符合 实 
际 情况 ， 因 为 现代 真实 的 处 理 器 都 有 外 部 存储 器 。 这 也 说 明了 处 理 咒 如 何 与 外 部 世界 进行 通信 。 

处 理 器 包括 了 数据 路 径 和 控制 器 。 控 制 句 由 主 译 码 器 和 ALU 译 码 器 构成 。 图 7-59 显示 了 
具有 外 部 存储 器 接口 的 单 周 期 MIPS 处 理 器 的 框图 。 
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图 7-59 ”具有 外 部 存储 器 接口 的 MIPS 单 周 期 处 理 器 


硬件 描述 语言 代码 分 为 多 个 部 分 。7. .6.1 节 提 供 了 单 周 期 处 理 器 数据 路 径 和 控制 器 的 
HDL, 7.6.2 市 描述 微 结构 中 的 通用 模块 ， 如 寄存 器 、 复 用 器 等 。7. 6. 3 节 介 绍 基准 测试 程序 
和 外 部 存储 咽 。 人 硬件 描述 语言 的 电子 版 本 可 以 从 本 书 的 网 站 上 下 载 (请 参见 前 言 )。 

7.6.1 Si ja) RA ANTE SS 
单 周 期 MIPS 处 理 器 的 主 模块 由 下 述 硬件 描述 语言 例子 给 出 。 
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HDL 例 7.1 单 周 期 MIPS 处 理 器 


SystemVerilog VHDL 
module mips(input logic clk, reset, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
el Set eee aad entity mips is -- single cycle MIPS processor 
auRplitrTegte i WE port(clk, reset: in STD_LOGIC; 
output Togic [31:0] aluout, Wh pe: out STD_LOGIC_VECTOR(31 downto 0); 
input topie (31:0) readdatels instr: in STD_LOGIC_VECTOR(31 downto 0); 
f memwrite: out STD_LOGIC; 
logic memtoreg, alusrc, regdst, aluout, writedata: out STD_LOGIC_VECTOR(31 downto 0); 
regwrite, jump, pcsrc, zero; readdata: in STD_LOGIC_VECTOR(31 downto 0)); 
logic [2:0] alucontrol; end; 
controller c(instr(31:26], instr[5:0], zero, architecture struct of mips is 
memtoreg, memwrite, pesrc, component controller 
alusrc, regdst, regwrite, jump, port(op, funct: in STD_LOGIC_VECTOR(5 downto 0); 
alucontrol); zero: in STD_LOGIC; 
datapath dp(clk, reset, memtoreg, pcsrc, memtoreg, memwrite: out STD_LOGIC; 
alusrc, regdst, regwrite, jump, pesrc, alusrc: out STD_LOGIC; 
alucontrol, regdst, regwrite: out STD_LOGIC: 
zero, pc, instr, jump: out STD_LOGIC; 
aluout, writedata, readdata); alucontrol: out STD_LOGIC_VECTOR(2 downto 0)); 
endmodule 


end component; 
component datapath 
port(clk, reset: in STD_LOGIC; 
memtoreg, pcsrc: in STD_LOGIC; 
alusrc, regdst: in STD_LOGIC; 
regwrite, jump: in STD_LOGIC; 


alucontrol: in STD_LOGIC_VECTOR(2 downto 0); 
zero: out STD_LOGIC; 

pc: buffer STD_LOGIC_VECTOR(31 downto 0); 
instr: in STD_LOGIC_VECTOR(31 downto 0); 
aluout, writedata: buffer STD_LOGIC_VECTOR(31 downto 0); 
readdata: in STD_LOGIC_VECTOR(31 downto 0)); 


end component; 
signal memtoreg, alusrc, regdst, regwrite, jump, pcsrc: STD_LOGIC; 
signal zero: STD_LOGIC; 
signal alucontrol: STD_LOGIC_VECTOR(2 downto 0); 
begin 
cont: controller port map(instr(31 downto 26), 
instr(5 downto 0), zero, memtoreg, 
memwrite, pesrc, alusrc, regdst, 
regwrite, jump, alucontrol); 
dp: datapath port map(clk, reset, memtoreg, pcsrc, alusrc, 
regdst, regwrite, jump, alucontrol, 
zero, pc, instr, aluout, writedata, 
readdata); 
end; 





HDL $i] 7.2 控制 器 





SystemVerilog VHDL 
module controller(input logic [5:0] op, funct, library IEEE; use IEEE.STD_LOGIC_1164.a11; 
dii lt ph niic entity controller is -- single cycle control decoder 
tion fet am wha port(op, funct: in STD_LOGIC_VECTOR(5 downto 0): 
f ' : zero: in STD_LOGIC; 
prises pe a POST be, memtoreg, memwrite: out STD_LOGIC; 
f x : pesrc, alusrc: out STD_LOGIC; 
output logic [2:0] alucontrol); regdst.,.reqwrite:: out. STD.ALOGIC: 
logic branch: alucontrol: out STD_LOGIC_VECTOR(2 downto 0)); 
end; 


maindec md(op, memtoreg, memwrite, branch, 
alusrc, regdst, regwrite, jump, aluop); 
aludec ad(funct, aluop, alucontrol); 


architecture struct of controller is 
component maindec 


port(op: in STD_LOGIC_VECTOR(5 downto 0); 
assign pcsrc=branch & zero; memtoreg, memwrite: out STD_LOGIC; f 
endmodule branch, alusrc: out STD_LOGIC; 
regdst, regwrite: out STD_LOGIC; 
jump: out STD_LOGIC; 
aluop: out STD_LOGIC_VECTOR(1 downto 0)); 


end component; 
component aludec 
port(funct: in STD_LOGIC_VECTOR(5 downto 0); 
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aluop: in STD_LOGIC_VECTOR(1 downto 0); 
alucontrol: out STD_LOGIC_VECTOR(2 downto 0)); 
end component; 
signal aluop: STD_LOGIC_VECTOR(1 downto 0); 
Signal branch: STD_LOGIC; 
begin 
md: maindec port map(op, memtoreg, memwrite, branch, 
alusrc, regdst, regwrite, jump, aluop); 
ad: aludec port map(funct, aluop, alucontrol); 
pesrc <= branch and zero; 
end; 
HDL $7.3 主 译 码 器 
SystemVeriiog VHDL 


module maindec(input logic [5:0] op, 
output logic memtoreg, memwrite, 
output logic branch, alusrc, 
output logic regdst, regwrite, 
output logic jump, 
- output logic [1:0] aluop); 


logic [8:0] controls; 


assign {regwrite, regdst, alusrc, branch, memwrite, 
memtoreg, jump, aluop}=controls; 


always_comb 
case(op) 

6'b000000: controls <=9'b110000010; // RTYPE 
6'b100011: controls <=9'b101001000; // LW 
6'b101011: controls <= 9'b001010000; // SW 
6'b000100: controls <=9'b000100001; // BEQ 
6'b001000: controls <= 9°b101000000; // ADDI 
6'b000010: controls <= 9*b000000100; // J 


default: controls <= 9'Dxxxxxxxxx; // illegal op 
endcase 
endmodule 
HDL i] 7. 4 
SystemVerilog 


module aludec(input logic [5:0] funct, 
input logic [1:0] aluop, 
output logic [2:0] alucontrol); 


always_comb 
case(aluop) 
2'b00: alucontrol <= 3'b010; // add (for Iw/sw/addi) 
2*b01: alucontrol <= 3'b110; // sub (for beq) 
default: case(funct) // R-type instructions 
6'b100000: alucontrol <= 3'b010; // add 
6'b100010: alucontrol <= 3'b110; // sub 
6'b100100: alucontrol <=3'b000; // and 
6'b100101: alucontrol <= 3'b001; // or 
6'b101010: alucontrol <= 3'b111; // sit 
default: alucontrol <= 3'bxxx; // ??? 
endcase 
endcase 
endmodule 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity maindec is -- main control decoder 
port(op: in STD_LOGIC_VECTOR(5 downto 0); 
memtoreg, memwrite: out STD_LOGIC; 
branch, alusrc: out STD_LOGIC; 
regdst, regwrite: out STD_LOGIC: 
jump: out STO_LOGIC; 
aluop: out STD_LOGIC_VECTOR(1 downto 0)); 
end; 


` 


architecture behave of maindec is 
signal controls: STD_LOGIC_VECTOR(8 downto 0); 
begin 
process(all) begin 
case op is 
when "000000" => controls <= "110000010"; -- RTYPE 
when "100011" => controls <= *101001000"; -- LW 
when "101011" => controls <= "001010000"; -- SW 
when "000100" => controls <= "000100001"; -- BEQ 
when "001000" => controls <= "101000000"; -~ ADDI 
when "000010" => controls <= "000000100"; -- J 
when others => controls <= "--------- "; == i] legal op 
end case; 
end process; 


(regwrite, regdst, alusrc, branch, memwrite, 
memtoreg, jump, aluop(1 downto 0)) <= controls; 
end; 


ALU 译 码 器 
VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.al1; 


entity aludec is -- ALU control decoder 
port(funct: in STD_LOGIC_VECTOR(5 downto 0); 
aluop: in STD_LOGIC_VECTOR(1 downto 0); 
alucontrol: out STD_LOGIC_VECTOR(2 downto 0) ) ; 
end; 


architecture behave of aludec is 
begin 
process(all) begin 
case aluop is 
when "00" => alucontrol <= "010"; =- add (for lw/sw/addi) 
when "01" => alucontrol <= "110"; -- sub (for beq) 
when others => case funct is -- R-type instructions 
when "100000" => alucontrol <= "010"; -- add 
when "100010" => alucontrol <= "110"; -- sub 
when "100100" => alucontrol <= "000"; -- and 
when "100101" => alucontrol <= "001"; -- or 
when "101010" => alucontrol <= "111"; -- slt 
when others => alucontrol <="---"; -- ??? 
end case; 
end case; 
end process; 
end; 
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SystemVerilog 


module datapath(input 
input 
input 
input 
input 
output 
output 
input 
output 
input 


logic 
logic 
logic 
logic 
logic 
logic 
logic 
logic 
logic 
logic 


logic [4:0] writereg; 
logic [31:0] penext, pcnextbr, pcplus4, pcbranch; 
logic [31:0] signimm, signimmsh; 


logic [31:0] srca, src 
logic [31:0] result; 


// next PC logic 


b; 


[2:0] 


[31:0] 
[31:0] 
[31:0] 
[31:0] 


HDL 例 7.5 数据 路 径 


clk, reset, 
memtoreg, pesrc, 
alusrc, regdst, 
regwrite, jump, 
alucontrol, 

zero, 

pe, 

instr, 

aluout, writedata, 
readdata); 


flopr #(32) pcreg(clk. reset, pcnext, pc): 


adder pceaddl(pe, 32°b100, pcplus4); 
$12 immsh(signimm, signimmsh); 
adder pcadd2(pcplus4, signimmsh, pcbranch); 


mux2 #(32) pcbrmux(pcplus4, pcbranch, pcsrc, pcnextbr); 


mux2 #(32) pcmux(pcnextbr, {pcplus4[31:28], 
instr(25:0], 2'b00}, jump, pcnext):; 


// register file logic 


regfile rf(cik, regwrite, instr(25:21], instr[20:16], 


writereg, result, srca, writedata); 
mux2 #(5) wrmux(instr[20:16], instr{15:11], 


regdst, writereg); 
mux2 #(32) resmux(aluout, readdata, memtoreg, result); 


signext se(instr[15:0], signimm); 


// ALU logic 


mux2 #(32) srcbmux(writedata, signimm, alusrc, srcb); 


alu alu(srca, srcb, alucontrol, aluout, zero); 


endmodule 
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library IEEE; use [EEE.STD_LOGIC_1164.a11; 
use IEEE.STD_LOGIC_ARITH.al1; 
entity datapath is -- MIPS datapath 
port(clk, reset: in STD_LOGIC; 
memtoreg, pesrc: in STD_LOGIC;: 
alusre, regdst: in STD_LOGIC; 
reqwrite, jump: in STD_LOGIC; 
alucontrol: in STD_LOGIC_VECTOR(2 downto 0); 
zero: out STD_LOGIC; | 
pe: buffer STD_LOGIC_VECTOR(31 downto 0); 
instr: > in STD_LOGIC_VECTOR(31 downto 0); 
aluout, writedata: buffer STD_LOGIC_VECTOR(31 downto 0); 
° readdata: in STD_LOGIC_VECTOR(31 downto 0)); 
end; 
architecture struct of datapath is 
component alu 
port(a, bd: in STD_LOGIC_VECTOR(31 downto 0); 
alucontrol: in STD_LOGIC_VECTOR(2 downto 0); 
result: buffer STD_LOGIC_VECTOR(31 downto 0); 
zero: out STD_LOGIC); 
end component; 
component regfile 
port(clk: in STD_LOGIC; 
we3: in STD_LOGIC; 
ral, ra2, wa3: in STD_LOGIC_VECTOR(4 downto 0); 
wd3: in STD_LOGIC_VECTOR(31 downto 0); 
rdl. rd2: out STD_LOGIC_VECTOR(31 downto 0)); 
end component; 
component adder 
port(a, b: in STD_LOGIC_VECTOR(31 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end component; 
component S12 
portla: in STD_LOGIC_VECTOR(31 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end component; 
component signext 
port(a: in STD_LOGIC_VECTOR(15 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end component; 
component flopr generic(width: integer); 
port(clk, reset: in STD_LOGIC; 
d: in STD_LOGIC_VECTOR(width-1 downto 0); 
3 q: out STD_LOGIC_VECTOR(width-1 downto 0)); 


end component; 
component mux2 generic(width: integer); 
port(d0, dl: in STD_LOGIC_VECTOR(width-1 downto 0); 

Ss in STD_LOGIC; 

y: out STD_LOGIC_VECTOR(width-1 downto 0)): 
end component; 
signal writereg: STD_LOGIC_VECTOR(4 downto 0); 
signal pcjump, pcnext, 

pcnextbr, pcplus4, 

pcbranch : STD_LOGIC_VECTOR(31 downto 0); 
signal signimm, signimmsh: STD_LOGIC_VECTOR(31 downto 0); 
signal srca, srcb, result: STD_LOGIC_VECTOR(31 downto 0); 

begin 
-= next PC logic 
pcjump <= pcplus4(31 downto 28) & instr(25 downto 0) & "00"; 
pcreg: flopr generic map(32) port map(clk, reset, pcnext, pc); 
pcaddl: adder port map(pc, X"00000004", pcplus4); 
immsh: s12 port map(signimm, signimmsh); 
pcadd2: adder port map(pcplus4, signimmsh, pcbranch); 
pcbrmux: mux2 generic map(32) port map(pcplus4, pcbranch, 
pesrc, pcenextbr); 
pcmux: mux2 generic map(32) port map(pcnextbr, pcjump, jump, 
pcnext); 
-- register file logic 
rf: reqfile port map(clk, regwrite, instr(25 downto 21), 
instr(20 downto 16), writereg, result, srca, 


writedata); 
wrmux: mux2 generic map(5) port map(instr(20 downto 16), 
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7.6.2 通用 模块 
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instr(15 downto 11), 
regdst, writereg); 
resmux: mux2 generic map(32) port map(aluout, readdata, 
memtoreg, result); 
se: signext port map(instr(15 downto 0), signimm); 


-- ALU logic 

srcbmux: mux2 generic map(32) port map(writedata, signimm, 
alusrc, srcb); 

mainalu: alu port map(srca, srcb, alucontrol, aluout, zero); 


end; 


本 节 描 述 了 可 以 用 于 任意 MIPS 微 结 构 的 通用 模块 ， 包 括 寄存 器 文件 、 加 法 器 、 左 移 单元 、 
符号 扩展 单元 、 可 复位 触发 器 和 复 用 器 。ALU 的 硬件 描述 语言 留 在 习题 5. 9。 


HDL 例 7.6 寄存 器 文件 


SystemVerilog 


module regfile(input logic clk, 
input logic we3, 
input logic [4:0] ral, ra2, wa3, 
input logic [31:0] wd3, 
output logic [31:0] rdl, rd2); 


logic (31:0) rf(31:0]; 


// three ported register file 

// read two ports combinationally 

// write third port on rising edge of clk 

// register 0 hardwired to 0 

// note: for pipelined processor, write third port 
// on falling edge of clk 


always_ff @(posedge clk) 
if (we3) rf[wa3] <=wd3; 


assignrdl=(ral !=0) ? rf[ral] : 0; 
assign rd2=(ra2!=0) ? rf{ra2]: 0; 
endmodule 


VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 
use IEEE.NUMERIC_STD_UNSIGNED.al1; 


entity regfile is -- three-port register file 


port(clk: in STD_LOGIC; 
we3: in STD_LOGIC; 
ral, ra2, wa3: in STD_LOGIC_VECTOR(4 downto 0); 
wd3: in STD_LOGIC_VECTOR(31 downto 0); 
rdl, rd2: out STD_LOGIC_VECTOR(31 downto 0)); 
end; 


architecture behave of regfile is 
type ramtype is array (31 downto 0) of STD_LOGIC_VECTOR(31 
downto 0); 
signal mem: ramtype; 
begin 
-- three-ported register file 
~- read two ports combinationally 
-- write third port on rising edge of clk 
-- register 0 hardwired to 0 
-- note: for pipelined processor, write third port 
-- on falling edge of clk 
process(clk) begin 
if rising_edge(clk) then 
if we3='1' then mem(to_integer(wa3)) <=wd3; 
end if; 
end if; 
end process; 
process(all) begin 
if (to_integer(ral)=0) then rdl <= X"00000000"; 
-- register 0 holds 0 
else rdl <=mem(to_integer(ral)); 
end if; 
if (to_integer(ra2)=0) then rd2 <= X"00000000" ; 
else rd2 <= mem(to_integer(ra2)); 
end if; 
end process; 
end; 





HDL $7.7 加 法 器 





SystemVerilog 


module adder(input logic [31:0] a, b, 
output logic [31:0] y); 


assign y=a+b; 
endmodule 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 
use IEEE.NUMERIC_STD_UNSIGNED.al11; 


entity adder is -- adder 
port(a, b: in STD_LOGIC_VECTOR(31 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end; 


architecture behave of adder is 
begin 

y <=a+b; 
end; 
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HDL 例 7.8 左 移 2 位 ( 乘 以 4) 


SystemVerilog 


module sl2(input logic [31:0] a, 
output logic [31:0] y); 
// shift left by 2 
assign y={aLl29:0], 2'b00}; 


endmodule 
HDL 例 7. 9 

SystemVerilog 
module signext(input logic [15:0] a, 

output logic [31:0] y); 

assign y= {{16{a[15]}},. a}; 
endmodule 
HDL 例 7. 10 

SystemVerilog 
module flopr #(parameter WIDTH=8) 

(input logic clk, reset, 

input logic [WIDTH-1:0]d, 


output logic [WIDTH-1:0] q); 


always_ff @(posedge clk, posedge reset) 
if (reset) q <=0; 


else q <=d; 
endmodule 
HDL i] 7. 11 
SystemVerilog 


module mux2 #(parameter WIDTH=8) 
(input logic [WIDTH-1:0] dO, dl, 
input logic S$. 
output logic [WIDTH-1:0] y); 


assign y=s ? dl : d0; 
endmodule 


VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity sl2 is -- shift left by 2 
port(a: in STD _LOGIC_VECTOR(31 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end; 


architecture behave of sl2 is 
begin 

y <=a(29 downto 0) & "00"; 
end; 


符号 扩展 
VHDL 


library IEEE; use [EEE.STD_LOGIC_1164.a11; 


entity signext is -- sign extender 
port(a: in STD_LOGIC_VECTOR(15 downto 0); 
y: out STD_LOGIC_VECTOR(31 downto 0)); 
end; 


architecture behave of signext is 
begin 

y <= X"ffff" & a when a(15) else X"0000" &a; 
end; 


可 复位 触发 器 


VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 
use IEEE.STD_LOGIC_ARITH.al1; 


entity flopr is -- flip-flop with synchronous reset 
generic (width: integer); 
port(clk, reset: in STD_LOGIC; 
d: in STD_LOGIC_VECTOR(width-1 downto 0); 
q: out STD_LOGIC_VECTOR(width-1 downto 0)); 
end; 


architecture asynchronous of flopr is 
begin 
process(clk, reset) begin 
if reset then q <= (others => '0'); 
elsif rising_edge(clk) then 
q <=d; 
end if; 
end process; 
end; 


2:1 复 用 器 
VHDL 


library IEEE; use IEEE.STD_LOGIC_1164.a11; 


entity mux2 is -- two-input multiplexer 
generic(width: integer :=8); 
port(d0, dl: in STD_LOGIC_VECTOR(width-1 downto 0); 
$i in STD_LOGIC; 
y: out STD_LOGIC_VECTOR(width-1 downto 0)); 
end; 


architecture behave of mux2 is 
begin 

y <=dl when s else d0; 
end; 
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7.6.3 基准 测试 程序 


MIPS 基准 测试 程序 将 一 段 程序 装 人 存储 占 中 。 图 7-60 中 的 程序 通过 计算 检查 所 有 指令 ， 
只 有 当 所 有 指令 都 正确 运行 时 才能 得 到 正确 的 结果 。 有 具体 地 ， 如 果 该 程序 运行 完全 正确 ， 则 应 
向 地 址 84 写 和 人 值 7， 如 果 硬 件 有 问题 就 不 可 能 这 么 做 。 这 种 测试 访问 称 为 随机 测试 (ad hoc tes- 


ting) o 


# mipstest.asm 
# David_Harris@hmc.edu, Sarah_Harris@hmc.edu 31 March 2012 
# 
# Test the MIPS processor. 
# add, sub, and, or, slt, addi, Iw, sw, beq, j 

# If successful, it should write the value 7 to address 84 


# Assembly 
main: addi $2, 
addi 
addi 
or 
and 
add 
beq 
silt 
beq 
addi 
silt 
add 
sub 
SW 
Iw 


$2, 84($0) 


Description Address 
# initialize $2=5 
# initialize $3=12 
# initialize $7 =3 
#$4=(30R5) =7 

# $5 = (12 AND7) =4 
#$5=4+7=11 

# shouldn't be taken 
#$4=12<7=0 

# should be taken 

# shouldn’t happen 
#$4=3<5=1 
#$7=1+11=12 
#$7=12-5=7 

# [80] =7 

# $2= [80] =7 

# should be taken 

# shouldn't happen 
# write mem[84] =7 





17-60 MIPS 测试 程序 的 汇编 代码 和 机 器 代码 


机 怖 代码 存储 在 十 六 进 制 文件 memfile. dat 中 ( 见 图 7-61) ， 这 个 文件 在 模拟 时 由 基准 测 
试 程序 装 入 。 这 个 文件 包含 了 指令 的 机 器 代码 ， 其 中 每 条 指令 一 行 。 


图 7-61 


20020005 
2003000c 
206/7f ff7 
00e22025 
00642824 
00a42820 
10a7000a 
0064202a 
10800001 
20050000 
00e2202a 
00853820 
00e23822 
ac6/0044 
8c020050 
08000011 
20020001 
ac020054 





memfile. dat 的 A 


Machine 

20020005 
2003000c 
2067fff7 
00e22025 
00642824 
00a42820 
10a7000a 
0064202a 
10800001 
20050000 
00e2202a 
00853820 
00e23822 
ac6/0044 
8c020050 
08000011 
20020001 
ac020054 


基准 测试 程序 、 顶 层 MIPS 模块 和 外 部 存储 器 HDL 代码 由 下 例子 给 出 。 该 例子 中 的 存储 器 


均 包 含 了 64 个 字 。 


微 休 系 结构 


HDL 例 7. 12 


SystemVerilog 
module testbench(); 


logic clk; 
logic reset; 


logic [31:0] writedata. dataadr; 
logic memwrite; - 


// instantiate device to be tested 
top dut (clk, reset, writedata, dataadr, memwrite); 


// initialize test 
initial 
begin 
reset <=1; #22; reset <=0; 
end 


// generate clock to sequence tests 
always 
begin 
clk <=1: #5: clk <=0; #5; 
end 


// check results 
always @(negedge clk) 
begin 
if (memwrite) begin 
if (dataadr===84 & writedata===/7) begin 
$display("Simulation succeeded"); 
$stop; 
end else if (dataadr !==80) begin 
$display("Simulation failed”); 
$stop; 
end 
end 
end 
endmodule 
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MIPS 基准 测试 程序 


VHDL 


library IEEE; 
use IEEE,STD_LOGIC_1164.a11; use IEEE. NUMERIC_STD_UNSIGNED.all; 


entity testbench is 
end: 


architecture test of testbench is 
component top 
port(clk, reset: in STD_LOGIC; 
writedata, dataadr: out STD_LOGIC_VECTOR(31 downto 0); 
memwrite: out STD_LOGIC); 
end component; 
Signal writedata, dataadr: STD_LOGIC_VECTOR(31 downto 0): 
Signal clk, reset, memwrite: STD_LOGIC; 
begin 


-- instantiate device to be tested 
dut: top port map(clk, reset, writedata, dataadr, memwrite); 


-- Generate clock with 10 ns period 
process begin 

clk <= "1": 

wait for 5ns; 

clk <= '0'; 

wait for 5 ns; 
end process; 


-- Generate reset for first two clock cycles 
process begin 

reset <= '1'; 

wait for 22 ns; 

reset <= '0'; 

wait; 
end process; 


-- check that 7 gets written to address 84 at end of program 
process(clk) begin 
if (clk'event and clk='0' and memwrite='1') then 
if (to_integer(dataadr) =84 and to_integer 
(writedata)=7) then 
report "NO ERRORS: Simulation succeeded” severity failure; 
elsif (dataadr /= 80) then 
report "Simulation failed” severity failure; 
end if; 
end if; 
end process; 
end; 





HDL 4 7.13 MIPS 顶层 模块 





SystemVerilog 


module top(input logic clk, reset, 
output logic [31:0] writedata, dataadr, 
output logic memwrite); 


logic [31:0] pc, instr, readdata; 


// instantiate processor and memories 


mips mips(clk, reset, pc, instr, memwrite, dataadr, 


writedata, readdata); 
imem imem(pc[7:2], instr); 


dmem dmem(clk, memwrite, dataadr, writedata, readdata); 


endmodule 


VHDL 


library IEEE; 
use IEEE. STD_LOGIC_1164.a11; use IEEE.NUMERIC_STD_UNSIGNED.al1; 


entity top is -- top-level design for testing 
port(clk, reset: in STD_LOGIC; 
writedata, dataadr: buffer STD_LOGIC_VECTOR(31 downto 0); 
memwrite: buffer STD_LOGIC); 
end; 


architecture test of top is 
component mips 


port(clk, reset: in STD_LOGIC; 


pe: out STD_LOGIC_VECTOR(31 downto 0); 
instr: in STD_LOGIC_VECTOR(31 downto 0); 
memwrite: out STD_LOGIC; 


aluout, writedata: out STD_LOGIC_VECTOR(31 downto 0); 
readdata: in STD_LOGIC_VECTOR(31 downto 0)); 

end component; 

component imem 

port(a: in STO_LOGIC_VECTOR(5 downto 0); 

rd: out STD_LOGIC_VECTOR(31 downto 0)); 

end component; 

component dmem 
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HDL 例 7. 14 
SystemVerilog 
module dmem(input logic clk, we, 
input logic [31:0] a, wd, 


output logic [31:0] rd); 
logic [31:0] RAM[63:0]; 
assign rd=RAM[a[31:2]]; // word aligned 


always_ff @(posedge clk) 
if (we) RAM[a(31:2]] <=wd; 
endmodule 


HDL 例 7. 15 
SystemVerilog 


module imem(input logic [5:0] a, 
output logic [31:0] rd); 


logic [31:0] RAM[63:0]; 
initial 
$¢readmemh("memfile.dat", RAM); 


assign rd=RAM[a]; // word aligned 
endmodule 


port(clk, we: in STD_LOGIC; 
a, wd: in STD_LOGIC_VECTOR(31 downto 0); 
rd: out STD_LOGIC_VECTOR(31 downto 0)); 


end component; 
signal pc, instr, 
readdata: STD_LOGIC_VECTOR(31 downto 0); 

begin 

-- instantiate processor and memories 

mipsl: mips port map(clk, reset, pc, instr, memwrite, 

dataadr, writedata, readdata); 

imeml: imem port map(pc(7 downto 2), instr); 

dmem1: dmem port map(clk, memwrite, dataadr, writedata, readdata); 
end; 


MIPS 数据 存储 器 
VHDL 


library IEEE; 
use IEEE.STD_LOGIC_1164.a11; use STD. TEXTIO.all; 
use [IEEE.NUMERIC_STD_UNSIGNED.al1; 


entity dmem is -- data memory 
port(clk, we: in STD_LOGIC; 
a, wd: in STD_LOGIC_VECTOR (31 downto 0); 
rd: out STD_LOGIC_VECTOR (31 downto 0)); 
end; 


architecture behave of dmem is 
begin 
process is 
type ramtype is array (63 downto 0) of 
STD_LOGIC_VECTOR(31 downto 0); 
variable mem: ramtype; 
begin 
-- read or write memory 
Joop 
if rising_edge(clk) then 
if (we='1') then mem (to_integer(a(7 downto 2) )):=wd; 
end if; 
end if; 
rd <= mem (to_integer(a (7 downto 2))); 
waitonclk, a; 
end loop; 


end process; 
end; 


MIPS 指令 存储 器 
VHDL 


library IEEE; 
use IEEE.STD_LOGIC_1164.a11; use STD. TEXTIO.all; 
use IEEE.NUMERIC_STD_UNSIGNED.al1; 


entity imem is -- instruction memory 
port(a: in STD_LOGIC_VECTOR(5 downto 0); 
rd: out STD_LOGIC_VECTOR(31 downto 0)); 
end; 


architecture behave of imem is 
begin 
process is 
file mem_file: TEXT; 
variable L: line; 
variable ch: character; 
variable i, index, result: integer; 
type ramtype is array (63 downto 0) of 
STD_LOGIC_VECTOR(31 downto 0); 
variable mem: ramtype; 
begin 
-- initialize memory from file 
for i in 0 to 63 loop -- set al] contenés low 
mem(i) := (others => '0'); 
end 100p; 
index :=0; 
FILE_OPEN (mem_file, "C:/docs/DDCA2e/hd1/memfile.dat", 
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READ_MODE); 
while not endfile(mem_file) loop 
readline(mem_file, L); 
result :=0; 
for i in 1 to 8 loop 
read (L, ch); 
if '0' <=ch and ch <= '9' then 
result := character'pos(ch) - character'pos('0'); 
elsif ‘a’ <= chand ch <= 'f' then 


result :=character'pos(ch) - character’pos(‘'a‘)+10; 


else report "Format error on line” & integer’ 
image(index) severity error; 
end if; 
mem( index)(35-i*4 downto 32-1*4) := 
to_std_logic_vector(result,4); 
end loop; 
index := index+1; 
end loop; 


-- read memory 
loop 
rd <= mem(to_integer(a)); 
wait ona; 
end loop; 
end process; 
end; 


7.7 异常 

6.7.2 节 中 介绍 了 异常 ， 它 引起 程序 流 的 意外 变化 。 在 本 节 中 ， 我 们 将 扩展 多 周期 处 理 器 
以 便 支 持 两 类 异常 : 未 定义 的 指令 和 算术 溢出 。 在 其 他 微 结 构 中 支持 的 异常 也 遵循 类 似 的 
原则 。 

如 6.7.2 节 所 述 ， 当 异常 发 生 时 ， 处 理 器 将 PC 复制 到 EPC 寄存 器 并 将 异常 代码 存储 在 标 
识 异 常 来 源 的 原因 寄存 器 中 。 异 常 原因 中 ，0x28 表示 未 定义 的 指令 ，0x30 表示 溢出 ( 见 表 6-7) 。 
然后 ， 处 理 器 跳 转 到 存储 器 地 址 Ox80000180 处 的 异常 处 理 程序 。 蜡 常 处 理 程 序 是 响应 异常 的 
代码 。 它 是 操作 系统 的 一 个 部 分 。 

6. 7. 2 节 还 指出 异常 寄存 器 是 协 处 理 器 0 的 一 个 部 分 ， 该 协 处 理 器 也 是 MIPS 处 理 器 中 用 
于 处 理 系 统 功能 的 一 部 分 。 协 处 理 器 0 最 多 可 定义 32 个 专用 寄存 器 ， 包 括 EPC 寄存 器 和 原因 
寄存 器 。 异 常 处 理 程序 可 以 使 用 mfc0( 从 协 处 理 器 0 移动 数据 ) 指令 将 这 些 专用 寄存 器 复制 到 
寄存 器 文件 中 的 通用 寄存 器 中 。 原 因 寄 存 器 是 协 处 理 器 0 的 寄存 器 13 EPC 寄存 器 是 协 处 理 器 
0 的 寄存 器 14。 

为 了 处 理 异 常 ， 必 须 在 数据 路 径 中 增加 EPC 寄存 器 和 原因 寄存 器 ， 扩 展 PCSrc 复 用 器 来 接 
收 异 常 处 理 程序 地 址 ， 如 图 7-62 所 示 。 这 两 个 新 的 寄存 器 具有 写 使 能 ( EPCWrite 和 Cause- 
Write) ， 在 发 生 异 常 时 存储 PC 和 异常 原因 。 为 异常 选择 合适 代码 的 复 用 器 产生 异常 发 生 的 原 
Al, ALU 还 必须 产生 溢出 信号 ， 如 5.2.4 FPR. 

为 支持 mfc0 指令 ， 应 该 增加 一 路 来 选择 协 处 理 器 0 寄存 器 并 将 它们 写 和 人 寄存 器 文件 ， 如 
图 7-63 所 示 。mfc0 指令 通过 Instris 来 指明 协 处 理 器 0 寄存 器 ， 在 图 中 仪 支持 了 原因 寄存 器 
和 EPC 寄存器。 我们 为 MemtoReg 复 用 器 增加 了 另 一 个 输入 以 便 从 协 处 理 器 0 中 选择 值 。 


O ”严格 地 讲 ，ALU 仅 应 该 只 为 add 和 sub 产生 溢出 信号 ， 而 不 为 其 他 ALU 指令 。 
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EPCWrite IntCause CauseWrite 





图 7-62 ”支持 溢出 和 未 定义 指令 异常 的 数据 路 径 


EPCWrite IntCause CauseWrite 





7-63 ”支持 mfc0 指令 的 数据 路 径 


修改 后 的 控制 器 如 图 7-64 所 示 。 控 制 器 从 ALU 接收 溢出 标志 。 它 产生 3 个 新 的 控制 信号， 
一 个 是 写 EPC; 一 个 是 写 原因 寄存 器 ; 最 后 一 个 是 选择 原因 寄存 器 。 它 还 包括 支持 两 个 异常 的 
两 个 新 的 状态 和 处 理 mfc0 指令 的 另 一 个 状态 。 
如 果 控 制 器 接收 到 一 个 未 定义 的 指令 (不 知道 应 该 如 何 处 理 的 指令 ) ， 它 转 至 S12， 将 PC 
保存 到 EPC 寄存 器 ， 向 原因 寄存 器 写 人 0x28 ， 并 跳 转 到 异常 处 理 程序 。 同 样 ， 如 果 控 制 器 检 
测 到 ada 或 sub 指令 的 算术 溢出 ， 它 转 至 S13, 将 PC 保存 到 EPC 寄存 器 ， 向 原因 寄存 器 写 人 
gay) 0x30， 并 跳 转 到 异常 处 理 程序 。 需 要 注意 的 是 ， 当 异常 发 生 时 ， 将 抛弃 发 生 异 常 的 指令 ， 其 结 
| 果 也 不 写 和 寄存 器 文件 。 当 译 码 mfc0 指令 时 ， 处 理 器 进入 S14, ， 并 选择 合适 的 协 处 理 器 0 寄 
443| 存 器 写 人 主 寄存 器 文件 中 。 
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$12: Undefined S14: MFCO 


CSre = 11 
PCWrite RegDst = 0 


IntCause = | Memtoreg = 10 
CauseWrite eh RegWrite 
PCWrite 
Op = others 


ta Op = MFCO 
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PCSrc = 10 
PCWrite 






ALUSrcA = 1 
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ALUSrcB = 





= 00 












S3: MemRead 


RegDst = | 
MemtoReg = 00 
RegWrite 











IntCause = 0 
CauseWrite 











RegWrite 


S4: Mem 
Writeback 


MemtoReg = 01 
RegWrite 


图 7-64 SHER AYA mfc0 的 控制 名 


7.8 高 级 微 体 系 结构 - 


高 性 能 微 处 理 器 使 用 多 种 技术 来 提高 程序 运行 速度 。 程 序 运 行 时 间 正 比 于 时 钟 周期 和 每 条 
指令 所 需 的 周期 数 (CPI) 。 因 此 ， 为 了 提高 性 能 ,我 们 喜欢 提高 时 钟 频率 ， 同 时 降低 CPI。 本 
节 将 介绍 一 些 已 有 的 加 速 技术 。 因 为 实现 细节 比较 复杂 ， 所 以 我 们 这 里 仅 主 要 介绍 原理 。 如 果 
你 想 进 一 步 了 解 细 节 ， Hennessy 和 Patterson fi 3 HYJ C Computer Architecture》 一 书 将 提供 合适 的 
参考 。 

每 过 两 三 年 ，CMOS 制造 工艺 的 进展 将 在 各 个 方向 减少 晶体 管 尺寸 30% ， 芯 片上 的 晶体 管 
的 数目 增加 一 倍 。 制 造 工 艺 由 特征 尺寸 (feature size) 标 识 ， 它 代表 了 能 可 靠 制造 的 最 小 晶体 管 
尺寸 。 蝇 体 管 尺寸 越 小 ， 其 速度 越 快 且 功 耗 越 低 。 因 此 ， 即 使 微 体 系 结构 不 发 生变 化 ， 由 于 所 
有 门 的 速度 变 快 ， 所 以 时 钟 主 频 也 能 提高 。 而 且 ， 更 小 的 尺寸 使 得 可 以 在 一 个 必 片 上 放置 更 多 
的 晶体 管 。 微 体系 结构 利用 这 些 增加 的 晶体 管 构成 更 复杂 的 处 理 器 ， 或 在 一 个 芯片 上 放置 多 个 
处 理 器 。 不 幸 的 是 ， 功 耗 随 着 晶体 管 的 数量 和 它 的 操作 频率 的 增加 而 增加 ( 见 1.8 市 )。 现 在 功 
耗 已 经 成 为 新 的 关注 点 。 微 处 理 器 设计 者 面临 的 挑战 是 ， 在 集成 了 数 十 亿 晶 体 管 的 芯片 上 构造 
人 类 有 史 以 来 最 为 复杂 的 系统 ， 同 时 对 速度 、 功 耗 和 成 本 等 因素 进行 折 中 。 
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7.8.1 深 流 水 线 


除了 制造 工艺 的 进步 外 ， 提 高 时 钟 频率 的 最 简单 方法 就 是 将 流水 线 划分 更 多 阶段 。 每 阶段 
包含 尽量 少 的 逻辑 ， 因 此 它 可 以 运行 得 更 快 。 本 章 考 虑 了 经 典 的 5 阶段 流水 线 ， 但 是 10 ~ 20 
阶段 流水 线 目前 已 得 到 广泛 应 用 。 

流水 线 阶 段 的 最 大 数 受 限于 流水 线 冲 突 、 时 序 开销 和 成 本 。 流 水 线 越 长 ， 其 相关 性 就 越 
多 。 有 些 相 关 性 可 以 通过 重 定向 解决 ， 但 另 一 些 相关 性 需要 阻塞 流水 线 ， 这 将 增加 CP RA 
阶段 之 间 的 流水 线 寄存 器 包含 了 clk-to-Q 延迟 和 建立 时 间 的 时 序 开销 (也 包括 时 钟 偏 移 ) 。 这 些 
时 序 开 销 使 得 增加 更 多 的 流水 线 阶段 反而 降低 了 回报 。 最 后 ， 因 为 需要 额外 的 流水 线 寄存 器 和 
处 理 冲 突 所 需 的 硬件 ， 所 以 增加 更 多 的 流水 线 阶段 将 增加 成 本 。 

深 流水 线 

考虑 将 单 周期 处 理 器 划分 为 N 阶段 (N=5 ) 来 创建 流水 线 处 理 器 。 在 单 周 期 处 理 器 中 整个 
组 合 逻 辑 的 延迟 为 875ps。 寄 存 器 的 时 序 开 销 为 50ps。 假 设 组 合 逻 辑 延 迟 可 以 划分 为 任意 阶段 ， 
而 且 流 水 线 冲 突 逻 辑 不 会 增加 延迟 。 例 7.9 中 的 5 阶段 流水 线 的 CPI 为 1. 15。 假 设 由 于 分 支 错 
误 预 测 和 其 他 流水 线 冲 突 ， 每 增加 一 阶段 流水 线 将 使 CPI 增加 0. 1。 请 问 采用 多 少 阶段 流水 线 
时 处 理 器 执行 程序 的 速度 最 快 ? 

解 : 如 果 将 875ps 的 组 合 逻辑 分 级 为 N 级 且 每 级 用 于 流水 线 寄 存 器 的 时 序 开销 为 50ps， 则 
周期 时 间 为 7. =875/N +50, CPL=1.15+0.1(N-5), 每 条 指令 的 时 间 为 周期 时 间 与 CPI 的 乘 
积 。 图 7-65 显示 了 周期 时 间 和 指令 时 间 与 流水 线 阶段 数 之 间 的 关系 。 指 令 时 间 在 N=11 时 达 
到 最 小 值 227ps。 这 个 最 小 值 仅仅 比 6 阶段 流水 线 达到 的 245ps 有 少许 提高 。 


300 
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PA i. * —o 7. 
if atin ee 
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时 间 ( ps ) 
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流水 线 阶段 数 
图 7-65 ”周期 时 间 和 指令 时 间 与 流水 线 阶 段 数 的 关系 
在 20 世纪 90 年 代 末 期 和 21 世纪 初 ， 微 处 理 器 市 场 大 多 取决 于 时 钟 频率 (1ZT.) 。 这 使 得 
处 理 器 使 用 了 非常 深 的 流水 线 (在 Pentium 4 上 有 20 ~31 阶段 ) 来 最 大 化 时 钟 频率 ， 即 使 这 对 整 


体 性 能 提升 是 否 有 帮助 仍 是 值得 怀疑 的 。 由 于 功 耗 正比 于 时 钟 频率 ， 而 且 也 随 着 流水 线 寄存 器 
数目 的 增加 而 增加 ， 所 以 目前 功 耗 变 得 更 加 重要 ， 流 水 线 深度 正在 减 小 。 < 


7.8.2 分 支 预测 


理想 流水 线 处 理 需 的 CPI 应 为 1。 分 支 错误 预测 代价 是 增加 CPI 的 主要 原因 。 流 水 线 越 深 ， 
在 流水 线 中 解决 分 支 就 越 晚 。 因 此 ， 分 支 错误 预测 代价 就 大 ， 因 为 必须 在 错误 预测 分 支 指令 刷 
新 后 提交 所 有 的 指令 。 为 解决 这 个 问题 ， 大 多 数 流水 线 处 理 器 使 用 分 支 预测 器 来 猜测 分 支 是 否 
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发 生 。 在 7.5.3 节 中 ， 流 水 线 简 单 地 预测 所 有 分 文 都 不 会 发 生 。 

有 些 分 支 发 生 在 程序 运行 到 一 个 循环 的 结束 (例如 ，for 或 while 语句 ) 时 ， 和 分 文 返回 
以 便 重 复 循 环 时 。 循 环 往往 需要 执行 多 次 ， 因 此 这 些 向 后 分 支 指令 通常 会 发 生 。 最 简单 的 分 支 
预测 是 检查 分 支 的 方向 ， 并 预测 后 向 分 支 应 该 发 生 。 这 称 为 静态 分 支 预测 ( static branch predic- 
tion) ， 因 为 它 不 依赖 于 程序 的 执行 历史 。 

在 不 了 解 具 体 程序 的 情况 下 ， 前 向 分 支 预测 往往 非常 困难 。 因 此 ， 大 多 数 处 理 需 采用 动态 
分 支 预测 器 (dynamic branch predictor) ， 它 使 用 程序 运行 的 历史 来 预测 分 支 是 否 发 生 。 动 态 分 文 
预测 器 保存 了 处 理 器 最 近 执 行 的 上 百 条 (或 者 上 千 ) 条 分 文 指 令 。 这 个 表 有 时 称 为 分 支 目 标 缓 
冲 器 (branch target buffer) ， 它 包含 了 分 文 的 目 的 地 址 和 此 分 支 是 否 发 生 的 历史 。 

考虑 代码 示例 6. 20 中 的 循环 代码 ， 分 析 动 态 分 支 预测 器 的 操作 。 这 个 循环 重复 10 次 ， 而 
且 跳 出 循环 的 beq 指令 仅 在 最 后 一 次 发 生 。 


add $sl, $0, $0 # sum=0 
addi $s0, $0, 0 # i =0 
addi $t0, $0, 10 # $t0=10 


ia $s0, $t0, done # if i== 10, branch to done 
add $sl, $sl, $s0 # sum=sum+ i 
addi $s0, $s0, 1 # increment i 
j for 

done: 

一 位 动态 分 支 预测 器 ( one-bit dynamic branch predictor) 记 住 最 后 一 次 的 分 支 是 否 发 生 ， 并 
预测 下 一 次 是 否 也 采取 同样 的 动作 。 当 循环 重复 时 ， 它 将 记 住 beg 指令 上 次 没有 发 生 分 文 ， 
并 且 预 测 它 下 次 也 不 会 发 生 分 支 。 在 循环 的 最 后 一 次 分 支 前 这 都 是 正确 的 预测 ， 当 最 后 一 次 执 
行 分 支 时 。 不 幸 的 是 ， 如 果 循 环 再 次 执行 ， 分 支 预测 器 记 住 了 最 后 一 次 执行 的 分 支 。 因 此 ， 在 
循环 第 一 次 重新 执行 时 它 错 误 地 预测 这 个 分 支 将 发 生 。 总 之 ， 一 位 动态 分 文 预 测 需 错误 地 预测 
循环 的 第 一 次 和 最 后 一 次 分 文 。 

两 位 动态 分 支 预 测 器 通过 4 个 状态 来 解决 这 个 问题 : 强 跳 转 ( strongly tanke), 55 3e 4 
(weakly taken) 、 弱 不 跳 转 ( weakly not taken) 、 强 不 跳 转 (strongly not taken)， 如 图 7-66 所 示 。 
当 循环 重复 时 ， 它 将 进入 “ 强 不 跳 转 ”状态 ， 并 预测 分 支 下 一 次 不 会 发 生 。 这 个 预测 将 一 直 
正确 直到 循环 的 最 后 一 次 分 支 ， 该 分 支 执行 并 使 预测 器 转移 到 “ 弱 不 跳 转 ”状态 。 当 循环 再 
次 执行 时 ， 分 支 预测 器 正确 预测 分 支 不 会 发 生 ， 并 再 次 进入 “ 强 不 跳 转 ”状态 。 总 之 ， 两 位 
BAS SY SC THM a A ita a aaa 


强 跳 转 55k 弱 不 跳 转 强 不 跳 转 





图 7-66 位 分 支 预测 器 的 状态 转换 图 


可 以 想象 ， 分 支 预测 器 可 以 跟踪 更 多 的 程序 执行 轨迹 以 便 提高 预测 的 准确 性 。 对 于 典型 程 
序 ， 好 的 预测 器 可 以 达到 超过 90% 的 准确 性 。 

分 支 预测 器 在 流水 线 的 取 指 阶段 运行 ， 这 样 它 可 以 确定 下 一 个 周期 需要 执行 哪 条 指令 。 当 它 
预测 分 支 将 发 生 时 ， 处 理 器 从 存储 在 分 支 目 标 缓冲 器 中 的 分 支 目 标 指令 中 取出 下 一 条 指令 。 在 分 
支 目 标 缓冲 器 中 保存 分 支 指 令 和 跳 转 指令 的 轨迹 ， 处 理 器 可 以 避免 在 跳 转 指令 期 间 刷 新 流水 线 。 
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7. 8.3 超标 量 处 理 希 


超标 量 处 理 器 (Superscalar processor) 具有 多 个 数据 路 径 硬 件 以 便 支 持 同 时 执行 多 条 指令 。 
图 7-67 显示 了 每 个 周期 取 指 和 执行 两 条 指令 的 两 路 超标 量 处 理 器 的 框图 。 数 据 路 径 从 指令 存 
储 器 中 一 次 取出 两 条 指令 。 它 有 一 个 6 个 端口 的 寄存 器 文件 ， 每 个 周期 读 4 个 源 操作 数 ， 将 2 
个 结果 写 回 。 它 还 包含 两 个 ALU 和 一 个 两 端口 数据 存储 器 以 便 同 时 执行 两 条 指令 。 


CLK CLK CLK CLK 





图 7-67 超标 量 数据 路 径 


图 7-68 显示 了 两 路 超标 量 处 理 器 每 个 周期 执行 2 条 指令 的 流水 线 图 。 对 于 这 个 程序 ， 处 
理 器 的 CPI 为 0.5。 设 计 者 往往 采用 CPI 的 倒数 作为 每 周期 的 指令 数 (Instruction Per Cycle, 
IPC)。 对 于 这 个 程序 此 处 理 右 的 IPC 为 2。 


8 


时 间 ( 周期 ) 
lw $t0, 40($s0) 


L i 
add $ti, $sl, $522 f 


sub St2, SS $83 


and $t3, $s3, $s4 


or S$t4, $sl1, $s5 


sw $s5, 80(S$s0) 





图 7-68 超标 量 流水 线 操作 示意 图 


由 于 相关 性 问题 ， 同 时 执行 多 条 指令 是 比较 困难 的 。 例 如 ,图 7-69 显示 了 执行 具有 数据 
相关 性 的 程序 的 流水 线 图 。 代 码 中 的 相关 性 用 浅 灰 色 表 示 。add 指令 依赖 于 lw 指令 产生 的 
$t0， 因 此 它 不 能 与 1w 指令 同时 提交 。 实 际 上 ，ada 指令 还 阻塞 了 男 一 个 周期 ， 这 样 lw 指 
令 可 以 在 周期 5 将 Sto 的 将 值 重 定 同 给 它 。 其 他 的 相关 性 (包括 基于 $t0 的 sub 和 and 之 间 
的 相关 性 ， 基 于 $t3 的 or 和 sw 之 间 的 相关 性 ) 采 用 重 定 回 方式 处 理 ， 即 一 个 周期 产生 的 结果 
在 下 一 个 周期 使 用 。 如 下 所 示 的 这 个 程序 需要 5 个 周期 来 提交 6 条 指令 ， 因 此 IPC 为 1.17。 

lw $t0, 40($s0) 

add $tl, $t0, $sl 

sub $t0, $s2, $s3 

and $t2, $s4, $t0 


or $t3, $s5, $s6 
sw $s/7, 80($t3) 
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lw t0, 40($s0) fi 
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= pa PIH 

eee, 
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mj. | 
sub $t0, $s2, $83 y : 


and $t2, $s4, cs A = im set 
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"y 
te y 
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图 7-69 具有 数据 相关 性 的 程序 


并 行 性 有 时 间 和 空间 两 种 形式 。 流 水 线 是 一 种 时 间 并 行 。 多 个 执行 单元 是 一 种 空间 并 行 。 
超标 量 处 理 器 利用 这 两 种 并 行 性 ， 使 其 性 能 远 远 超 越 了 单 周 期 和 多 周期 处 理 器 。 
商业 处 理 占 已 经 是 三 路 、 四 路 ， 甚 至 六 路 超标 量 结构 。 它 们 必须 处 理 控制 冲突 (如 分 支 ) 
和 数据 冲突 。 不 幸 的 是 ， 真 实 的 程序 具有 很 多 相关 性 ， 因 此 超标 量 处 理 右 几乎 无 法 完全 利用 所 
有 的 执行 单元 。 而 且 ， 大 量 的 执行 单元 和 复杂 的 重 定 向 网 络 消耗 了 大 量 的 电路 和 功率 。 


7.8.4 乱 序 处 理 器 


为 了 解决 相关 性 问题 ， 乱 序 处 理 器 (out-of- order processor) 首 先 检 查 多 条 指令 是 否 可 以 提 
交 ， 或 者 尽 可 能 早 地 开始 执行 不 相关 的 指令 。 指 令 提 交 执 行 的 顺序 可 以 不 同 于 程序 员 所 写 的 顺 
序 ， 只 要 保持 相关 性 就 可 以 使 程序 得 到 正确 结果 。 

考虑 在 两 路 超标 量 乱 序 处 理 器 上 执行 图 7-69 的 程序 。 只 要 保持 相关 性 ， 处 理 器 每 个 周期 
从 程序 中 的 任何 位 置 提 交 两 条 指令 。 图 7-70 显示 了 数据 相关 性 和 处 理 器 的 操作 。 相 关 性 可 以 
TARJ S (RAW) 和 稍 后 将 讨论 的 写 后 读 (WAR ) 两 类 。 提 交 指 令 的 约束 将 在 下 面 介绍 。 

e 周期 1 












Wee 





sw $s7, 80( ) 





-提交 lw 指令 
-add、sub 和 and 指令 通过 Sto 依赖 于 lw 指令 ， 因 此 它们 还 不 能 提交 。 然 而 ，or 
指令 是 无 关 的 ， 因 此 它 可 以 提交 。 
。 周期 2 


- 记 住 在 lw 指令 提交 且 相 关 指令 可 以 使 用 它 的 结果 之 间 需 要 两 个 周期 的 延迟 ， 因 此 由 
F $t0 的 相关 性 ， 所 以 add 指令 不 能 提交 。sub 指令 写 St0， 因 此 它 不 能 在 add 
指令 之 前 提交 ， 以 免 add 指令 接收 到 错误 的 St0 1H. and 指令 依赖 于 sub 指令 。 
-只 有 sw 指令 可 以 提交 。 
© 周期 3 
-在 周期 3，sSt0 的 值 可 以 使 用 ， 因 此 add 指令 提交 。sub 指令 同时 提交 ， 因 为 它 在 
add 指令 使 用 St0 后 才 写 St0 。 
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e 周期 4 
-and 指令 提交 。 将 $to 从 sub 指令 重 定 问 到 and 指令 。 
乱 序 处 理 器 在 4 个 周期 中 提交 了 6 条 指令 ， 因 此 IPC 为 1.5。 


1 2 3 4 5 6 7 8 
时 间 (周期 ) 






lw S$t0, 40($s0) 





or $t3)\ $s5, $s6 








sw $97, ¥ 


aioe: JE 


rae 





add Stl, 


Ii 





eii 


图 7-70 具有 相关 性 程序 的 乱 序 执行 


add 指令 和 lw 指令 通过 Sto 的 相关 性 为 写 后 读 ( Read After Write, RAW) HH, RA 
lw 指令 写 人 $t0 后 add 指令 才能 读 出 。 我 们 在 流水 线 处 理 器 中 已 经 了 解 如 何 处 理 这 种 类 型 的 
相关 性 。 这 种 相关 性 从 本 质 上 限制 了 程序 运行 的 速度 ， 即 使 有 无 限 多 的 执行 单元 可 以 利用 。 类 
似 地 ，sw 指令 和 or 指令 通过 St3 的 相关 性 ， 以 及 anad 指令 和 sub 指令 通过 sto 的 相关 性 是 
RAW 相关 的 。 

sub 指令 和 add 指令 通过 $t0 的 相关 性 是 读 后 写 ( Write After Read, WAR) 冲突 ， 或 称 为 
反 相 关 (antidependence) 。 在 add 指令 读 St0 前 sub 指令 不 能 写 ， 这 样 add 指令 才能 根据 程序 
的 原始 执行 顺序 获得 正确 的 值 。WAR 冲突 不 会 发 生 在 简单 的 MIPS 流水 线 处 理 器 中 ,但 是 ， 如 
果 相 关 的 指令 (在 本 例 中 为 sub 指令 ) 过 早 地 提前 ， 它 们 会 出 现在 乱 序 处 理 器 中 。 

WAR 冲突 不 是 程序 执行 所 不 可 避免 的 。 它 只 是 程序 员 为 两 条 不 相关 的 指令 使 用 了 同一 
寄存 器 而 人 为 造成 的 冲突 。 如 果 sub 指令 已 经 将 结果 写 入 St4 (而 不 是 St0 ) ， 那 么 相关 性 就 
HAT, sub 指令 可 以 在 add 指令 之 前 提交 。MIPS 体系 结构 只 有 32 个 寄存 器 ， 因 此 有 时 程序 
员 不 得 不 在 所 有 其 他 寄存 器 都 已 使 用 的 情况 下 重用 一 个 寄存 器 ， 从 而 产生 冲突 。 

第 三 类 冲突 为 写 后 写 ( Write After Write, WAW ) akii tk 48 X (output dependence), ERA 
在 程序 中 显示 出 来 。WAW 冲突 发 生 在 一 条 指令 试图 向 后 一 条 指令 已 经 写 入 的 寄存 器 中 写 人 。 
RS RES Aa at. PIU, FE FEEF, add 指令 和 sub 指令 都 写 St0 寄存 
器 。 根 据 程 序 的 顺序 ， Sto 寄存 器 中 的 最 后 结果 应 来 自 sub 指令 。 如 果 乱 序 处 理 器 试图 先 执 
行 sub 指令 ， 则 WAW 冲突 将 发 生 。 


add $t0, $sl, $s2 
sub $t0, $s3, $s4 


WAW 冲突 也 不 是 不 可 避免 的 。 而 且 ， 它们 也 是 程序 员 为 两 条 不 相关 的 指 人 
Es 


念 使 用 了 同一 个 
寄存 占 人 为 产生 的 。 如 果 首 先 提交 sub 指令 ， 则 程序 可 以 通过 丢弃 add 指令 结果 
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存 器 的 方式 来 解决 WAW 冲突 。 这 称 为 去 除 (squashing) add 指令 ” 。 

乱 序 处 理 器 使 用 一 个 称 为 记分 牌 ( scoreboard ) 的 表 来 保持 指令 等 待 提 交 的 次 序 ， 记 录 相 关 
性 的 信息 。 这 个 表 的 大 小 决定 了 可 以 考虑 提交 的 指令 数 。 在 每 个 周期 ， 处 理 器 检查 这 个 表 并 提 
交 尽 可 能 多 的 指令 ， 而 仅仅 受 限于 程序 单元 的 相关 性 和 可 用 的 执行 单元 数 (例如 ，ALU、 存 储 
器 端口 等 ) 。 

指令 级 并 行 (Instruction Level Parallelism，ILP) 是 针对 特定 程序 和 微 体 系 结构 上 同时 可 以 执行 
的 指令 数 。 理 论 研 究 表 明 对 于 具有 好 的 分 支 预测 器 和 大 量 的 执行 单元 的 乱 序 微 体系 结构 ILP 可 以 
相当 高 。 但 是 ， 即 使 采用 了 6 路 超标 量 乱 序 执行 数据 结构 ， 实 际 处 理 器 的 ILP 也 很 难 超 过 2 或 3。 


7.8.5 寄存 器 重 命名 


乱 序 处 理 器 使 用 称 为 寄存 器 重 命名 (register renaming) 的 方法 来 消除 WAR WR, AF FF an E 
命名 给 处 理 器 增加 一 些 非 体系 结 构 的 重 命名 寄存 器 (renaming register) 。 例 如 ，MIPS 处 理 硕 可 
以 增加 20 个 重 命名 寄存 器 Sro ~ $r19。 因 为 这 些 寄存 器 不 是 体系 结构 的 一 个 部 分 ， 所 以 程序 
员 不 能 直接 使 用 它们 。 但 是 ， 处 理 器 可 以 自由 使 用 它们 来 解决 冲突 。 

例如 ， 在 前 一 节 中 ，sub 指令 和 add 指令 在 重用 sto 时 发 生 WAR 冲突 。 乱 序 处 理 器 可 以 
将 sub 指令 的 $t0 重 命名 为 Sz0。 因 此 ， 由 于 $r0 寄存 器 与 add 指令 没有 相关 性 ， 所 以 sub 
指令 可 以 尽快 执行 。 处 理 器 保存 了 一 个 表 来 表示 哪些 寄存 器 被 重 命名 了 ， 这 样 后 续 的 相关 指令 
可 以 在 寄存 器 的 重 命 名 上 保持 一 致 。 在 此 例 中 ，and 指令 也 必须 将 St0 寄存 器 重 命 名 为 Sr0 
寄存 器 ， 因 为 这 个 寄存 器 包含 了 sub 指令 的 结果 。 

图 7-71 显示 了 图 7-70 中 的 相同 程序 在 具有 寄存 器 重 命名 机 制 的 乱 序 处 理 器 上 的 执行 过 程 。 
在 sub 和 and 中 St0 寄存 器 重 命名 为 Sro 以 便 解 决 RAW 冲突 。 指 令 提交 的 约束 如 下 所 述 。 


l 2 3 4 K 6 7 





时 间 (周期 ) 


Wie 
eee 


Vena 





sw $s7, 80 @ 


图 7-71 使 用 寄存 器 重 命 名 的 程序 的 乱 序 执行 


o 周期 1 
-提交 lw 指令 。 
- HF add 指令 在 St0 上 依赖 于 1w 指令 ， 所 以 它 不 能 提交 。 然 而 ， 由 于 sub 指令 的 
目的 寄存 器 被 重 命名 为 $r0， 所 以 它们 变 为 不 相关 的 指令 因此 它 可 以 提交 。 


日 ”读者 可 能 会 考虑 为 什么 还 要 提交 add 指令 。 原 因 在 于 乱 序 处 理 器 必须 确保 产生 的 异常 与 程序 在 顺序 处 理 器 
上 运行 所 产生 的 异常 完全 相同 。add 指令 可 能 产生 洲 出 异常 ， 因 此 即使 它 的 结果 会 被 丢弃 ， 也 必须 提交 它 
来 检查 异常 是 否 发 生 。 
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。 周期 2 
- 记 住 在 lw 指令 提交 和 使 用 其 结果 的 相关 指令 之 间 需 要 两 个 周期 ， 因 此 由 于 Sto 寄 
存 器 的 相关 性 所 以 add 指令 不 能 提交 。 
-and 指令 依赖 于 sub 指令 ， 所 以 它 可 以 提交 ， 而 Sro 寄存 器 从 sub 指令 重 定 问 到 


and 指令 。 
-or 指令 是 不 相关 的 ， 因 此 可 以 提交 。 
e 周期 3 
-在 周期 3，$t0 可 以 使 用 ， 因 此 add 指令 提交 。 $t3 也 可 以 使 用 ， 因 此 sw 指令 
提交 。 


带 寄存 器 重 命名 的 乱 序 处 理 器 可 以 在 3 个 周期 内 提交 6 条 指令 ， 因 此 其 IPC 为 2。 


7.8.6 单 指令 流 多 数据 


单 指令 流 多 数据 流 (Single Instruction Multiple Data，SIMD ) 是 指 一 条 指令 并 行 对 多 个 数据 片 
进行 操作 。SIMD 的 一 个 典型 应 用 是 在 图 像 处 理 领 域 中 同时 执行 多 个 比较 短 的 算术 操作 ， 这 也 
称 为 打包 (packed) 算 术 。 

例如 ， 一 个 32 位 微 处 理 器 可 以 将 4 个 8 位 数 padas $s2, $s0, $s1 
据 元 素 打 包 在 一 个 32 位 字 中 。 打 包 的 加 法 和 减法 31. «24.23. “Vets 8 7 0 位 位 置 
指令 对 在 一 个 字 中 的 4 个 数据 元 素 并 行 操作 。 | 。 | a | | a] 
图 7-72 显 示 了 对 4 对 8 位 数据 元 素 执 行 打包 的 8 位 | base 
加 法 以 便 产生 4 个 结果 。 一 个 32 位 字 也 可 以 分 解 “ 上 a < 
为 两 个 16 位 元 素 。 执 行 打包 算术 需要 修改 ALU 以 

便 消除 较 小 数据 单元 之 间 的 进位 。 例 如 ， 从 ag + ve 
中 得 到 的 进位 不 应 该 影响 a, +b, 的 结果 。 图 7-72 ”打包 算术 : 4 个 并 行 的 8 位 加 法 
短 的 数据 元 素 经 常 出 现在 图 像 处 理 中 。 例 如 ， 
数字 图 像 中 的 一 个 像素 可 能 针对 红 、 绿 和 蓝 等 每 个 原色 分 别 采用 8 位 数据 存储 。 使 用 一 个 完整 
的 32 位 字 处 理 一 个 原色 将 浪费 24 位 。 当 将 4 个 相 邻 像素 的 原色 值 打 包 到 一 个 32 位 字 中 ， 处 理 
速度 可 以 提高 4 倍 。 
SIMD 指令 对 64 位 体系 结构 更 有 用 ， 它 可 以 将 8 个 8 位 元 素 ， 或 4 个 16 位 元 素 , 或 2 个 32 
位 元 素 打 包 到 一 个 64 位 字 中 。SIMD 指令 也 可 以 用 于 浮 点 计算 。 例 如 ， 可 以 将 4 个 32 位 单 精 
度 浮 点 值 打 包 到 一 个 128 位 字 中 。 


7.8.7 多 线程 


由 于 实际 程序 的 指令 级 并 行 性 往往 相当 低 ， 所 以 为 超标 量 处 理 器 或 乱 序 处 理 器 增加 执行 单 
元 得 到 的 回报 在 不 断 下 降 。 男 一 个 问题 是 存储 器 的 速度 远 低 于 处 理 器 (将 在 第 8 章 中 讨论 ) K 
量 的 装 人 和 存储 访问 一 个 比较 小 而 快 的 高 速 缓存 (cache)。 然 而 ， 当 指令 或 数据 不 在 高 速 缓存 
中 时 ， 处 理 器 将 阻塞 上 百 个 周期 以 便 从 主 存 中 读 取 信息 。 多 线程 技术 可 以 在 一 个 程序 的 指令 级 
并 行 性 比较 低 或 因 存储 器 访问 而 阻塞 时 ， 保 持 处 理 器 中 的 多 个 执行 单元 处 于 有 效 工 作 状态 。 

为 了 解释 多 线程 ,我 们 需要 引入 一 些 新 的 概念 。 在 计算 机 上 运行 的 程序 称 为 进程 
(process) 。 计 算 机 可 以 同时 运行 多 个 进程 。 例 如 ， 你 可 以 在 PC 机 上 听 音 乐 的 同时 上 网 和 检查 
病毒 。 每 个 进程 可 以 包含 一 个 或 多 个 可 以 同时 运行 的 线程 (thread) 。 例 如 ， 字 处 理 器 程序 中 有 
一 个 线程 来 处 理 用 户 的 输入 ， 另 一 个 线程 用 于 检查 当前 用 户 文档 的 拼写 ， 第 三 个 线程 负责 输出 
文档 。 这 样 ， 用 户 就 不 需要 在 输出 结束 前 等 待 ， 而 可 以 直接 可 以 继续 输入 。 一 个 进程 拆 分 成 多 
个 并 发 线程 的 程度 ， 决 定 了 它 的 线程 级 并 行 性 (Thread Level Parallelism，TLP) 水 平 。 
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在 传统 的 处 理 融 中 ， 多 个 线程 的 同时 运行 只 是 一 个 假 相 。 在 操作 系统 的 控制 下 线程 在 一 个 
处 理 带 上 依次 执行 。 当 一 个 线程 运行 结束 时 ， 操 作 系统 将 保存 其 体系 结构 状态 ， 加 载 另 一 个 线 
程 的 体系 结构 状态 并 开始 运行 它 。 这 个 过 程 称 为 上 下 文 切 换 ( context switching)。 只 要 处 理 器 能 
足够 快 地 切换 所 有 的 线程 ， 用 户 就 会 产生 所 有 线程 同时 运行 的 假 相 。 

多 线程 处 理 咒 包含 了 一 个 以 上 的 体系 结构 状态 ， 因 此 可 以 有 一 个 以 上 的 线程 处 于 活跃 状态 。 
例如 ， 如 果 我 们 将 MIPS 处 理 右 扩展 为 具有 4 个 PC 和 128 个 寄存 器 ， 那么 就 可 以 有 4 个 线程 同时 
运行 。 如 果 一 个 线程 因为 等 待 主 存 中 的 数据 而 阻塞 ， 处 理 器 就 可 以 没有 任何 延迟 地 切换 到 另 一 个 
线程 ， 因 为 线程 的 PC 和 寄存 器 都 是 可 以 立即 访问 的 。 而 且 ， 当 一 个 线程 缺乏 足够 的 并 行 性 不 能 
使 所 有 的 执行 单元 都 保持 工作 状态 时 ， 男 一 个 线程 就 可 以 向 空闲 的 执行 单元 提交 指令 。 

多 线程 处 理 器 不 能 提高 指令 级 并 行 性 ， 也 不 能 提高 单个 线程 的 性 能 。 但 是 ， 它 可 以 提高 处 
理 促 的 总 吞吐 量 ， 因 为 执行 单个 线程 时 可 能 不 能 完全 利用 处 理 器 的 资源 ， 而 多 个 线程 可 以 同时 
使 用 这 些 资 源 。 而 且 多 线程 处 理 融 仅仅 复制 了 PC 和 寄存 器 文件 ,但 没有 增加 执行 单元 或 存储 
ft, TULA SE BURR RAS AA MT PE BE 
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多 处 理 器 ( multiprocessor) 系统 包含 了 多 个 处 理 器 以 及 这 些 处 理 器 之 间 的 通信 机 制 。 构 造 计 
算 机 系统 中 多 处 理 器 的 常用 方法 是 同 构 多 处 理 技 术 (homogeneous multiprocessing) ， 又 称 为 对 称 
多 处 理 技术 (Symmetric MultiProcessing，SMP) ， 其 中 两 个 或 多 个 相同 的 处 理 器 共享 一 个 主 存 。 

多 个 处 理 器 可 以 是 在 多 个 单独 的 芯片 ， 也 可 以 是 同一 个 芯片 上 的 多 个 核 (eore) 。 现 代 处 理 
器 可 以 使 用 非常 多 的 晶体 管 。 使 用 这 些 晶 体 管 来 增加 流水 线 深度 或 执行 单元 并 不 能 显著 提高 性 
能 ， 而 且 功 耗 很 高 。2005 年 前 后 ， 计 算 机 体系 结构 开始 转 回 在 同一 个 必 片 上 构造 多 个 处 理 硕 ， 
这 些 处 理 噩 称 为 核 。 

多 处 理 器 可 以 用 于 同时 运行 多 个 线程 ， 或 者 使 特定 线程 运行 得 更 快 。 同 时 运行 多 个 线程 的 
方法 很 简单 : 只 要 将 这 些 线程 分 配 到 多 个 处 理 器 上 。 但 是 ，PC 用 户 往往 在 特定 的 时 间 内 只 需 
要 运行 少量 的 线程 。 提 高 特定 线程 运行 速度 更 具有 挑战 性 。 程 序 员 必须 将 一 个 线程 分 解 成 多 
片 ， 以 便 运行 在 多 个 处 理 器 上 。 在 多 个 处 理 器 需要 互相 通信 时 这 将 变 得 更 加 困难 。 如 何 有 效 利 
用 大 量 的 处 理 器 核 是 计算 机 系统 设计 者 和 程序 员 面 临 的 重要 问题 之 一 。 

其 他 多 处 理 技 术 包括 异 构 多 处 理 和 集群 。 异 构 多 处 理 器 (asymmetric multiprocessor) ， 又 称 
为 非 对 称 多 处 理 器 (asymmetric multiprocessors) ， 使 用 单独 的 专用 处 理 器 完成 特定 的 任务 ， 有 具体 
内 容 将 在 下 一 节 讨 论 。 在 集群 多 处 理 (cluster multiprocessing) 中， 每 个 处 理 器 具有 自己 的 局 部 存 
储 器 系统 。 集 群 可 以 将 一 组 PC 通过 网 络 连 接 起 来 ， 运 行 软 件 以 便 联 合 解决 一 个 比较 大 的 问题 。 


7.8.9 FA SAME 


在 7. 8.8 节 中 描述 的 同 构 多 处 理 器 有 许多 优点 。 它 们 设计 起 来 相对 简单 ， 因 为 处 理 器 一 旦 
设计 好 了 ， 就 可 以 复制 多 次 ， 从 而 增加 性 能 。 在 同 构 多 处 理 器 上 编程 和 执行 代码 也 相对 简单 ， 
因为 任何 程序 可 以 在 系统 中 的 任意 处 理 器 上 运行 ， 并 实现 大 致 相同 的 性 能 。 

不 幸 的 是 ， 继 续 添加 越 来 越 多 的 核 并 不 能 保证 提供 持续 的 性 能 改进 。 截 至 2012 年 ， 消 费 
类 应 用 程序 在 任意 给 定时 间 里 平均 只 使 用 2 ~ 3 个 线程 ， 一 个 典型 的 消费 者 实际 上 可 能 不 会 有 
几 个 应 用 程序 同时 运行 。 这 足以 让 双核 和 四 核 系统 保持 在 繁忙 状态 。 除 非 程 序 开始 显著 整合 更 
多 并 行 化 处 理 ， 和 否则 超过 这 个 界限 继续 增加 更 多 核 将 使 增加 核 的 好 处 递减 。 作 为 一 个 额外 的 问 
题 ， 因 为 通用 处 理 器 是 用 来 提供 良好 的 平均 性 能 的 ， 所 以 它们 一 般 都 不 是 执行 某 个 给 定 操作 的 
最 节能 选择 。 这 种 能 量 低 效 在 高 功率 受 限 的 便携 式 环境 中 尤其 重要 。 
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异 构 多 处 理 器 旨 在 通过 整合 不 同类 型 的 核 专用 硬件 在 一 个 系统 里 来 解决 上 述 问 题 。 每 个 应 
用 程序 使 用 那些 为 其 提供 最 佳 性 能 或 最 佳 功 率 性 能 比 的 计算 资源 。 因 为 现今 晶体 管 资 源 相 当 丰 
富 ， 所 以 不 是 每 一 个 应 用 程序 都 能 充分 使 用 每 一 块 硬件 这 个 事实 是 最 不 受 关注 的 。 异 构 系 统 可 
以 采取 多 种 形式 。 异 构 系 统 可 以 合并 具有 不 同 微 体 系 结构 的 处 理 需 核 ， 这些 核 拥有 不 同 的 功 
率 、 性 能 和 面积 折 中 。 例 如 ， 一 个 系统 可 能 包括 简单 的 单 问 题 有 序 核 和 更 复杂 的 超标 量 无 序 
核 。 可 以 有 效 地 利用 较 高 性 能 但 需要 更 高 功率 的 应 用 程序 ， 可 以 使 用 无 序 核 ， 而 其 他 不 能 有 效 
利用 额外 计算 能 力 的 应 用 程序 ， 可 以 使 用 更 加 节能 的 有 序 核 。 

在 这 样 的 系统 中 ， 所 有 核 可 以 全 部 使 用 相同 的 SA， 它 允许 应 用 程序 在 任意 多 个 核 中 运 
fT, 或 者 可 以 采用 不 同 的 ISA,， 它 允许 将 来 进一步 调整 某 个 核 来 执行 一 个 给 定 任 务 。IBM 的 
Cell 宽带 引擎 是 后 者 的 一 个 例子 。Cell 整合 了 一 个 双 问 题 有 序 功率 处 理 器 单元 ( Power Processor 
Element, PPE) 和 8 个 协作 处 理 器 单元 ( Synergistic Processor Element, SPE), SPE 使 用 一 个 新 的 
ISA, SPU ISA， 它 专 为 计算 密集 型 工作 负载 提供 高 能 源 效率 。 尽 管 可 能 存在 多 个 编程 范式 ， 但 
总 体 思路 是 ，PPE 处 理 大 部 分 的 控制 和 管理 决策 ， 如 划分 SPE 之 间 的 工作 量 ， 而 SPE 处 理 大 部 
分 的 计算 。Cell 的 异 构 性 使 得 它 能 够 在 给 定 功 耗 和 面积 的 情况 下 提供 比 传统 功率 处 理 器 高 得 多 
的 计算 性 能 。 

其 他 异 构 系统 可 能 包括 传统 的 处 理 器 核 和 专用 硬件 。 浮 点 协 处 理 器 ( floating- point coproces- 
sor) 是 一 个 早期 的 例子 。 在 早期 微 处 理 器 中 ， 主 芯片 上 没有 浮上 点 硬件 的 空间 。 对 浮 点 计算 感 兴 
趣 的 用 户 可 以 增加 一 块 可 提供 专用 浮 点 支持 的 单独 芯片 。 现 在 的 微 处 理 器 在 芯片 上 包含 一 个 或 
多 个 浮 点 数 单元 ， 并 且 开 始 包含 其 他 类 型 的 专用 硬件 。AMD 和 Intel 都 整合 了 图 形 处 理 单元 
(Graphics Processing Unit, GPU ) 或 FPGA 以 及 一 个 或 多 个 传统 x86 核 在 同一 块 必 片 上 。AMD 的 
Fusion 产品 线 和 英特尔 的 Sandy Bridge 是 第 一 批 整合 处 理 器 和 GPU 在 同一 块 品 粒 上 的 设备 。 英 
特 尔 的 E600( 斯 泰勒 ) 系 列 必 片 ， 于 2011 年 初 发 布 ， 在 同一 块 品 粒 上 集成 了 Atom 处 理 器 和 Al- 
tera FPCA。 从 芯片 水 平 来 看 ， 移 动 电话 包含 一 个 常规 处 理 郝 ， 用 来 处 理 用 户 交 互 ， 如 管理 电话 
往 、 处 理 网 站 和 玩 游 戏 ， 以 及 一 个 采用 专门 指令 来 实时 破译 无 线 数据 的 数字 信号 处 理 器 ( Digit- 
al Signal Processor，DSP) 。 在 功率 受 限 的 环境 中 ， 这 类 集成 专用 硬件 比 一 个 标准 核 提 供 更 好 的 
功 耗 性 能 折 中 。 

异 构 系 统 并 非 没 有 缺点 。 它 们 增加 了 系统 复杂 性 ， 无 论 是 在 设计 不 同 异 构 元 素 方 面 ， 还 是 
在 花费 额外 的 编程 工作 量 来 决定 何 时 以 及 如 何 利用 各 种 资源 方面 。 最 终 ， 同 构 和 异 构 系统 都 将 
可 能 找到 它们 的 位 置 。 同 构 多 处 理 器 在 有 大 量 线程 级 并 行 化 的 情况 下 使 用 良好 ， 如 大 数据 中 
心 。 异 构 系 统 则 有 利于 有 更 多 不 同 的 工作 负载 和 有 限 并行 化 的 情况 。 


7.9 从 现实 世界 看 : x86 微 体系 结构 ” 

6. 8 节 中 介绍 的 x86 体系 结构 广泛 应 用 于 几 L ge 
乎 所 有 的 PC 中 。 本 节 通 过 逐步 提高 的 速度 和 越 —eeeee 
来 越 复杂 的 微 体系 结构 来 跟踪 x86 处 理 器 的 发 展 
历程 。 我 们 对 MIPS 处 理 器 微 体系 结构 所 采用 的 
原则 对 x86 结构 也 有 效 。 

Intel 公司 在 1971 年 开发 了 第 一 个 单 芯 片 微 处 
理 器 一 -4 位 的 4004。 该 处 理 器 可 作为 行 式 计 算 
右 的 灵活 的 控制 絮 使 用 。 它 采用 线 宽 为 10um 的 
工艺 , 在 12mm 的 硅 片 上 集成 了 2300 个 晶体 管 ， 
主 频 为 730kHz。 显 微 镜 下 的 芯片 照片 如 图 7-73 —- 
所 示 。 图 7-73 4004 微 处 理 器 芯 
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与 对 4 fi Ub Bas ir I — E, AEA ER 4 列 相 似 的 结构 。 芯 片 的 四 周 是 引线 ， 用 


于 连接 芯片 和 封装 ， 并 一 直 连 接 到 电路 板 上 。 


4004 的 设计 激励 了 8 位 的 8008 和 后 来 的 8080， 并 最 终 演化 为 16 位 的 8086(1978 年 ) 和 
80286(1982 年 ) Intel 在 1985 年 推出 了 80386。 它 将 8086 体系 结构 扩展 到 32 位 ， 并 确定 了 
x86 体系 结构 。 表 7-7 总 结 了 Intel 主要 的 x86 微 处 理 器 。 从 4004 开始 的 40 年 内 ， 唱 体 管 的 特 
征 尺寸 缩 小 了 160 倍 ， 单 芯片 二 的 晶体 管 数 目 增长 了 5 个 数量 级 ,而且 工作 频率 增长 了 4 个 数 
量 级 。 没 有 其 他 工程 领域 能 在 如 此 短 的 时 间 内 取得 这 样 惊人 的 进展 。 


表 7-7 Intel x86 微 处 理 器 的 发 展 


微 处 理 器 年 份 
80386 1985 
80486 1989 
Pentium 1993 
Pentium II 1997 
Pentium III 1999 
Pentium 4 2001 
Pentium M 2003 
Core Duo 2005 
Core 2 Duo 2006 
Core i ~ series 2009 


特征 尺寸 (pm) 
1.5 二 1,0 

1.0 ~0.6 
0.8 ~0. 35 

0. 35 ~0. 25 
0.25 ~0. 18 
0. 18 ~0. 09 
0. 13 ~0. 09 
0. 065 

0. 065 ~ 0. 045 
0.045 ~0. 032 


pe IL 主 频 ( MHz) 
275k 16 ~25 
1. 2M 25 ~ 100 
3.2 ~4.5M 60 ~ 300 
7. 5M 233 ~ 450 
9. 5M ~ 28M 450 ~ 1400 
42 ~178M 1400 ~ 3730 
77 ~140M 900 ~ 2130 
152M 1500 ~ 2160 
167 ~410M 1800 ~ 3300 
382 ~731*M 2530 ~ 3460 


微 体系 结构 
多 周期 
流水 线 
超标 量 
乱 序 
乱 序 
乱 序 
乱 序 
双核 
双核 


multi- core 


80386 是 一 个 多 周期 处 理发。 其 主要 组 件 标注 在 图 7-74 所 示 的 必 片 图 上 。 左 侧 的 32 位 数 
据 路 径 清晰 可 见 。 每 一 列 处 理 一 位 数据 。 由 微 码 PLA 产生 的 一 些 控 制 信号 ， 控 制 有 限 状态 机 


的 每 个 状态 之 间 的 转移 。 右 上 角 的 存储 器 管理 单元 控制 对 外 部 存储 器 的 访问 。 
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图 7-75 中 的 80486 利用 流水 线 显著 地 提高 了 性 能 。 数 据 路 径 、 控 制 逻 辑 和 微 码 PLA 依然 
清晰 可 见 。80486 增加 了 片上 浮 点 单元 。 以 前 的 Intel 处 理 器 将 浮 点 指令 发 送 到 外 部 单独 的 协 处 
理 器 上 , 或 者 由 软件 仿真 实现 。80486 的 速度 很 快 ， 使 得 外 部 存储 器 无 法 跟 上 它 ， 因 此 它 集成 
了 一 个 8KB 的 高 速 缓存 来 存放 最 常用 的 指令 和 数据 。 第 8 章 将 更 详细 地 介绍 高 速 缓存 ， 并 将 再 
次 研究 Intel x86 处 理 需 高 速 缓存 系统 。 
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7-76 中 的 Pentium 处 理 需 是 一 个 可 以 同时 执行 两 条 指令 的 超标 量 处 理 顺 。 因 为 型 号 数字 
不 能 注册 商标 ， 同 时 AMD 公司 开始 销售 可 替换 的 80486 芯片 成 为 了 Intel 公司 的 强劲 对 手 ， 所 
以 Intel 公司 不 再 采用 80586 而 使 用 Pentium 来 命名 处 理 器 。Pentium 处 理 需 使 用 单独 指令 和 数 
据 高 速 缓存 。 同 时 还 包含 了 分 支 预测 喜来 减少 分 支 指令 的 性 能 损失 。 

Pentium Pro, Pentium II 和 Pentium HI 共享 同样 的 乱 序 微 体 系 结构 P6。 复 杂 的 x86 指令 被 分 
解 为 一 条 或 多 条 类 似 于 MIPS 指令 的 微 操 作 。 然 后 ， 这 些微 操作 在 11 阶段 流水 线 的 快速 乱 序 执 
行 核 上 执行 。 图 7-77 给 出 了 Pentium M 的 照片 。32 位 数据 路 径 称 为 整数 执行 单元 (Integer Exe- 
cution Unit，IEU) 。 浮 点 数据 路 径 称 为 浮 点 单元 (Floating Point Unit，FPU ) 。 处 理 器 还 有 一 个 
SIMD 单元 来 执行 对 短 整 数 和 浮 点 数据 的 成 组 操作 。 心 片 中 用 于 乱 序 提交 指令 的 面积 比 实际 执 
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行 指令 的 面积 还 要 大 。 指 令 和 数据 高 速 缓存 分 别 都 增加 到 16KB。 同 时 ，Pentium M 还 在 同一 世 
片上 包含 了 一 个 慢 速 的 256KB 二 级 高 速 缓存 。 
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图 7-77 Pentium II 微 处 理 器 芯片 


20 世纪 90 年 代 ， 处 理 器 市 场 主要 在 时 钟 速度 方面 竞争 。Pentium 4 fe 75 — FP AL Fp Ab Eh a, 
它 通过 非常 深 的 流水 线 来 达到 很 高 的 主 频 。 它 的 起 始 版 本 有 20 阶段 流水 线 ， 最 后 的 版 本 达到 
T 31 阶段 流水 线 ， 从 而 主 频 超过 了 3CHz。 图 7-78 所 示 的 芯片 包含 了 420 ~ 1780 万 个 晶体 管 
(取决 于 高 速 缓存 的 容量 ) ， 因 此 即使 最 大 的 执行 单元 也 难以 在 照片 上 看 到 。 由 于 指令 编码 复 
杂 且 不 规则 ， 所 以 在 如 此 高 的 频率 下 ， 在 一 个 周期 内 完成 3 条 IA-32 指令 的 译 码 是 不 可 能 的 。 
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相反 ， 处 理 器 将 指令 预先 译 码 为 一 些 简单 的 微 操 作 ， 然 后 将 微 操 作 存储 在 称 为 跟踪 缓存 (trace 
cache) 的 存储 器 中 。Pentium 4 的 后 续 版 本 还 支持 多 线程 以 便 提 高 多 个 线程 的 否 吐 量 。 
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Pentium 4 处 理 器 依赖 于 很 深 的 流水 线 和 很 高 的 时 钟 频 率 ， 这 将 导致 非常 高 的 功 耗 ， 有 时 候 ， 
功 耗 可 以 超过 100W。 这 对 笔记 本 电脑 是 不 可 接受 的 ， 而 且 导 致 桌面 计算 机 的 冷却 系统 非常 昂贵 。 

Intel 公司 发 现 原 有 的 Po 结构 也 可 以 在 较 低 的 主 频 和 功 耗 下 达到 类 似 的 性 能 。Pentium M 使 
用 增强 版 的 PO 乱 序 微 体 系 结构 ， 并 包含 32KB 的 指令 和 数据 高 速 缓存 ， 以 及 1 ~2MB 的 二 级 高 
RAFF. Core Dou 处 理 需 是 基于 两 个 Pentium M 处 理 器 核 的 多 核 处 理 器 。 这 两 个 处 理 顺 共享 一 
个 2MB 的 二 级 高 速 缓存 。 图 7-79 已 经 很 难看 出 单独 的 功能 单元 , 但 是 两 个 处 理 器 核 和 共享 的 
高 速 缓 存 则 清晰 可 见 。 





图 7-79 Core Due 微 处 理 器 芯片 
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2009 4F, Intel 提出 一 个 新 的 微 体系 结构 ， 代 号 为 Nehalem， 它 精简 了 原来 的 Core 微 体 系 结 
构 。 这 些 处 理 需 包括 Core i3, iS Mli7 系列 ， 指 令 集 扩展 到 64 位 。 这 些 处 理 器 提供 2~6 个 处 理 
器 核 , 3 ~ 15MB 的 第 三 级 高 速 缓存 ， 以 及 内 置 存 储 控制 器 。 有 些 处 理 器 模型 包含 内 置 图 形 处 理 
as, PRA BIG Aik B (graphics accelerator) 。 有 些 模型 支持 涡轮 增 压 技术 (Turbo- Boost) ， 通 过 
关闭 不 使 用 的 处 理 器 核 和 提高 增 压 处 理 顺 核 的 电压 和 时 钟 频率 ， 来 改善 单线 程 代码 的 性 能 。 有 
些 模 型 提供 “ 超 线 程 ” 技 术 (hyperthreading) ， 这 是 Intel 的 术语 ， 指 的 是 2 路 多 线程 ， 使 得 从 
用 户 的 角度 来 看 处 理 器 核 的 数量 翻 佑 。 图 7-80 展示 了 一 个 Core i7 晶 粒 ， 它 含有 4 个 处 理 器 核 
和 8MB 共用 L3 高速 缓存 。 
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图 7-80 Core i7 微 处 理 需 芯片 


(来 源 http://www. intel. com/pressroom/archive/releases/2008/20081117comp_ sm. htm. Courtesy Intel) 


7.10 总 结 


本 章 介 绍 了 3 种 构成 MIPS 处 理 器 的 方法 ,每 种 方法 在 性 能 和 成 本 上 都 各 有 侧重 。 我 们 发 
现 这 个 问题 非常 不 可 思议 : 像 处 理 器 这 样 表 面 上 非常 复杂 的 设备 实际 上 可 以 简单 地 用 一 张 半 页 
大 小 的 原理 图 来 表示 ? 而且， 其 内 部 运行 机 制 在 外 行 看 来 像 迷 一 样 难以 理解 ， 但 是 实际 上 却 非 
党 直观 。 

本 书 基本 上 对 MIPS 微 体 系 结构 中 涉及 的 主题 都 给 出 了 完整 的 电路 图 。 将 很 多 电路 拼 在 一 
起 构成 完整 的 微 体 系 结构 ， 这 个 过 程 也 说 明了 前 面 章 节 中 介绍 的 主要 原理 : 第 2、3 章 中 的 组 
合 电路 和 时 序 电路 设计 ; 第 5 章 中 的 电路 模块 应 用 ; 第 6 章 中 的 MIPS 体系 结构 实现 。MIPS 微 
结构 也 可 以 由 几 页 纸 的 硬件 描述 语言 表示 ， 这 需要 用 到 第 4 章 中 的 技术 。 

构造 微 体 系 结构 也 需要 使 用 管理 复杂 性 的 技术 。 微 体系 结构 抽 和 象形 成 了 数字 逻辑 和 体系 结 
构 之 间 的 链接 ， 也 构成 了 本 书 中 关于 数字 电路 设计 和 计算 机 体系 结构 的 要 点 。 我 们 也 可 以 使 用 
框图 和 硬件 描述 语言 的 抽象 来 简洁 地 描述 各 个 组 件 之 间 的 组 合 关 系 。 微 体系 结构 体现 了 规整 化 
和 模块 化 ， 重 用 了 ALU、 存 储 器 、 复 用 器 和 寄存 器 等 通用 部 件 。 同 时 ， 微 体系 结构 还 在 很 多 方 
面 使 用 了 层次 化 方法 。 微 体系 结构 可 以 分 为 数据 路 径 和 控制 单元 。 每 个 单元 通过 逻辑 模块 构 
造 ， 通 过 前 面 五 章 描述 的 技术 这 些 模块 可 以 由 逻辑 门 形成 ， 并 最 终 由 晶体 管 构 成 。 
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本 章 比 较 了 单 周 期 、 多 周期 和 流水 线 的 MIPS 处 理 器 微 体系 结构 。 所 有 这 三 种 微 体系 结构 
实现 了 MIPS 指令 系统 的 相同 子 集 ， 并 具有 相同 的 体系 结构 状态 。 单 周期 处 理 器 最 为 直观 ， 其 
CPI I 
多 周期 处 理 器 使 用 较 短 的 可 变 长 步骤 来 执行 指令 。 同 时 可 以 重用 ALU ， 而 不 需要 多 个 加 法 
器 。 然 而 ， 它 需要 多 个 非 体 系 结构 寄存 器 来 保存 各 个 步骤 之 间 的 中 间 结 果 。 由 于 所 有 指令 的 执 
行 时 间 不 完全 相同 ， 所 以 多 周期 设计 在 理论 上 应 该 更 快 。 在 本 例 中 ， 多 周期 实现 要 慢 一 些 ， 因 
为 它 受到 最 慢 步 又 和 各 个 步骤 之 间 时 序 开 销 的 限制 。 
流水 线 处 理 器 将 单 周 期 处 理 器 分 解 为 5 个 相对 较 快 的 流水 线 阶段 。 它 需要 在 各 个 阶段 之 间 
加 入 寄存 器 以 便 分 割 并 行 执行 5 条 指令 。 从 表面 上 看 ， 其 CPI 应 该 达到 1。 但 是 冲突 导致 的 流 
水 线 阻塞 和 刷新 会 稍微 增加 CPI。 冲 突 解决 也 需要 花费 额外 的 硬件 ， 并 增加 设计 复杂 性 。 理 想 
情况 下 ， 其 时 钟 周期 应 该 仅 为 单 周期 处 理 器 的 1/5。 实 际 上 ， 因 为 最 慢 流 水 线 阶 段 和 各 阶段 的 
时 序 开 销 ， 这 很 难 达 到 。 然 而 ， 流 水 线 提 供 了 潜在 的 性 能 优势 。 当 前 所 有 的 现代 微 处 理 器 都 使 
用 流水 线 。 
虽然 本 章 中 的 微 体系 结构 仅仅 实现 了 MIPS 指令 系统 的 一 个 子 集 ， 但 我 们 可 以 看 到 通过 扩 
展 数据 路 径 和 控制 器 的 功能 可 以 支持 更 多 的 指令 。 
本 章 的 一 个 主要 限制 是 我 们 假设 理想 的 存储 器 系统 ， 它 的 速度 足够 快 ， 而 且 容 量 足够 容纳 
完整 的 程序 和 数据 。 实 际 上 ， 大 容量 快速 存储 器 的 成 本 非常 高 。 下 一 章 将 介绍 如 何 将 存放 最 常 
使 用 信息 的 小 容量 快速 存储 器 与 存放 其 余 信息 的 大 容量 慢 速 存储 器 组 合 在 一 起 以 便 达到 大 容量 
快速 存储 器 的 效果 。 
习题 
7.1 假设 下 述 MIPS 单 周 期 处 理 器 控制 信号 中 的 一 个 发 生 了 固定 0 故障 (stuck-at-0 fault), B 
无 论 赋 任何 值 信号 始终 为 0。 哪 些 指令 会 产生 错误 ?为 什么 ? 
(a) RegWrite 
(b) ALUOp, 
(c) MemWrite 

7.2 重复 习题 7.1， 并 假设 信号 发 生 固定 1 故障 。 

7.3 修改 单 周 期 MIPS 处 理 器 以 实现 下 述 指令 之 一 。 附 录 B 给 出 了 指令 的 定义 。 在 图 7-11 的 
拷贝 上 标 出 对 数据 路 径 的 修改 。 命 名 新 的 控制 信号 。 在 表 7-8 的 拷贝 上 标 出 对 主 译 码 上 需 
的 修改 。 并 描述 其 他 需要 修改 的 内 容 。 


(a) sll 

(b) lui 

(c) slti 

(d) blez 

表 7-8 用 于 标记 改变 的 主 译 码 器 的 真 值 表 
指令 操作 码 RegWrite RegDst ALUSrc Branch MemWrite MemtoReg ALUOp 

R-type 000000 1 1 0 0 0 0 10 
lw 100011 ] 0 ] 0 0 l 00 
SW 101011 0 入 l 0 ] X 00 
beq 000100 0 X 0 1 0 X 01 


7.4 对 以 下 MIPS 指令 ， 重 复习 题 7.3。 
(a) jal 
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(b) lh 
(c) jx 
(d) srl 
许多 处 理 器 有 带 后 递增 的 装 入 (load with postincrement) 指令 。 该 指令 在 完成 装 人 操作 后 ， 
将 变 址 寄存 器 的 指针 指向 下 一 个 内 存 字 。1Lwinc Srt，imm( $rs) 等 价 于 下 述 两 条 指令 : 


Iw $rt, imm($rs) 
addi $rs, $rs, 4 


对 lwinc 指令 重复 习题 7.3。 有 可 能 增加 一 条 不 用 修改 寄存 器 文件 的 指令 吗 ? 
在 单 周 期 MIPS 处 理 器 中 增加 一 个 单 精 度 浮 点 单元 来 处 理 add. s, sub. s 和 mul. s 指令 。 
假设 你 已 经 有 可 以 用 的 单 精 度 浮 点 加 法 器 和 乘法 器 。 解 释 对 数据 路 径 和 控制 器 的 必要 修改 。 
你 的 朋友 是 优秀 的 电路 设计 工程 师 。 她 提出 重新 设计 单 周 期 MIPS 处 理 器 的 一 个 单元 ， 
以 便 降 低 一 半 的 延迟 。 使 用 表 7-6 中 给 出 的 延迟 ， 她 应 该 重新 设计 哪个 单元 以 便 获 得 整 
个 处 理 器 的 最 大 加 速 ， 改 进 后 的 周期 时 间 应 该 为 多 少 ? 
考虑 表 7-6 给 出 的 延迟 ，Ben 通过 设计 一 个 前 级 加 法 器 将 ALU 的 延迟 减少 了 20ps。 如 果 
其 他 元 件 的 延迟 保持 不 变 ， 请 确定 新 的 单 周 期 MIPS 处 理 需 的 周期 时 间 ， 以 及 执行 1000 
亿 条 指令 的 基准 测试 程序 所 需要 的 时 间 。 
假设 下 述 多 周期 MIPS 处 理 器 的 一 个 控制 信号 发 生 固定 0 故障 ， 即 无 论 输 入 值 为 多 少 ,， 此 
信号 总 为 0。 哪 些 指令 会 发 生 错误 ? 为 什么 ? 
(a) MemtoReg 
(b) ALUOp, 
(c) PCSre 
重复 习题 7.9， 并 假设 这 些 信和 号 发 生 固定 1 故障 。 
修改 7.6. 1 节 中 给 出 的 单 周 期 MIPS 处 理 器 的 HDL 代码 ， 以 便 处 理 习题 7.3 中 的 一 条 新 
指令 。 扩 充 7. 6.3 节 中 的 测试 程序 来 测试 新 的 指令 。 
对 习题 7.4 中 的 新 指令 重复 习题 7. 11。 
修改 多 周期 MIPS 处 理 器 来 实现 下 述 指令 中 的 一 条 。 附 录 B 给 出 了 指令 的 定义 。 在 图 7-27 
的 拷贝 上 标 出 了 对 数据 路 径 的 修改 。 命 名 新 的 控制 信号 。 在 图 7-39 的 拷贝 上 标 出 了 对 
Pe till aie FSM 的 修改 。 描 述 其 他 所 必需 的 修改 。 
(a) srlv e 
(b) ori 
(c) xori 
(d) jr 
对 以 下 MIPS 指令 ， 重 复习 题 7. 13. 
(a) bne 
(b) lb 
(¢) lbu 
(d) andi 
对 多 周期 MIPS 处 理 器 重复 习题 7.5。 给 出 对 多 周期 数据 路 径 和 控制 FSM 的 修改 。 有 可 
能 增加 一 条 不 用 修改 寄存 器 文件 的 指令 吗 ? 
对 多 周期 MIPS 处 理 器 重复 习题 7. 6。 
假设 习题 7. 16 中 的 浮 点 加 法 器 和 乘法 器 都 需要 2 个 周期 完成 操作 。 换 句 话 说 ,输入 在 
第 一 个 周期 开始 时 有 效 ， 输 出 在 第 二 个 周期 内 有 效 。 习 题 7. 16 的 答案 有 何 修改 ? 
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你 的 朋友 是 优秀 的 电路 设计 工程 师 。 她 提出 要 重新 设计 多 周期 MIPS 处 理 器 中 的 一 个 单 
元 来 提高 性 能 。 使 用 表 7-6 中 的 延迟 ， 她 应 该 重新 设计 哪个 单元 以 便 获 得 整个 处 理 器 的 
RAME? 应 该 达到 多 快 ? (如 果 快 得 超过 了 所 需要 的 值 ， 就 会 浪费 你 朋友 的 努力 。) 改 
进 后 的 处 理 嚣 周期 时 间 为 多 少 ? 
对 多 周期 处 理 器 重复 习题 7.8。 参 照例 7.7 的 指令 比例 。 
假设 多 周期 MIPS 处 理 希 部 件 延 迟 由 表 7-6 给 出 。Alyssa P. Hacker 设计 了 一 个 新 的 寄存 
器 文件 ， 其 功 耗 降低 了 40% ， 但 速度 却 慢 了 一 倍 。 她 应 该 将 这 个 慢 速 但 低 功 耗 的 寄存 
器 文件 应 用 于 多 周期 处 理 咒 的 设计 中 吗 ? 
Goliath 公司 宣称 拥有 3 端口 寄存 器 文件 的 专利 。 为 了 避免 与 Goliath Za) EAE, Ben 设 
计 了 一 个 新 的 寄存 器 文件 ， 它 仅仅 包含 一 个 读 / 写 端口 (就 像 组 合 指令 和 数据 存储 器 一 
样 ) 。 重 新 设计 MIPS 处 理 器 的 多 周期 数据 路 径 和 控制 器 以 便 使 用 这 个 新 的 寄存 器 文件 。 
习题 7. 21 中 重新 设计 的 多 周期 MIPS 处 理 器 的 CPI 为 多 少 ? 使 用 例 7.7 中 的 指令 比例 。 
在 多 周期 MIPS 处 理 右 上 运行 下 述 程序 。 需 要 多 少 个 周期 ? 这 个 程序 的 CPI 是 多 少 ? 
addi $s0, $0, done #result=5 


while: 
beq $s0, $0, done #if result > 0, execute while block 
addi $s0, $s0, -1 #while block: result=result-l 
j while 

done: 


对 下 述 程序 重复 习题 7. 23。 


add $s0, $0, $0 # i=0 
add $sl, $0, $0 # sum=0 
addi $t0, $0, 10 # $t0=10 


loop: 
slt $tl, $s0,$tO #if (i < 10), $tl=1, else $t1=0 
beq $t1, $0, done #if $tl==0 (i >=10), branch to done 
add $sl,$sl, $s0 #sum=sum+i 
addi $s0, $s0, 1 # increment i 
j loop 
done: 


为 多 周期 MIPS 处 理 器 写 硬 件 描述 语言 代码 。 处 理 器 应 与 下 述 项 层 模 块 兼容 。mem 模块 
用 于 存储 指令 和 数据 。 使 用 7. ©. 3 节 中 测试 程序 测试 你 的 处 理 器 。 


module top(input logic clk, reset, 
output logic [31:0] writedata, adr, 
output logic memwrite); 


logic [31:0] readdata; 


// instantiate processor and memories 
mips mips(clk, reset, adr, writedata, memwrite, readdata); 
mem mem(clk, memwrite, adr, writedata, readdata); 


endmodule 


module mem(input logic clk, we, 
input logic [31:0] a, wd, 
output logic [31:0] rd); 


logic [31:0] RAM[63:0]; 
initial 
begin 


$readmemh(“memfile.dat", RAM); 
end 
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7. 26 


7.27 
7.28 


7. 29 


7. 30 


7.31 


7. 36 


7. 37 


7. 38 


assign rd=RAM[a[31:2]]; // word aligned 
always @(posedge clk) 
if (we) 
RAM[a[31:2]] <= wd; 

endmodule 
扩展 你 的 多 周期 MIPS 处 理 器 HDL 代码 来 处 理 习 题 7. 13 中 的 一 条 新 指令 。 扩 展 测试 程 
序 以 测试 你 的 设计 。 
对 习题 7. 14 中 的 一 条 新 指令 ， 重 复习 题 7. 26。 
流水 线 MIPS 处 理 器 执行 下 述 指令 。 在 第 5 个 周期 内 有 哪个 寄存 器 正在 写 ， 哪 个 寄存 器 
正在 读 ? 
addi $sl, $s2, 5 
sub $t0, $tl, $t2 
Iw $t3, 15($s1) 
Sw $t5, 72($t0) 
or $t2, $s4, $s5 
对 以 下 MIPS 程序 ， 重 复习 题 7. 28。 流 水 线 MIPS 处 理 器 包含 一 个 冲突 单元 。 


add $s0, $t0, $tl 

sub $sl, $t2, $t3 

and $s2, $s0, $sl 

or . $53, S46, 355 

slt $s4, $52, $s3 

在 流水 线 MIPS 处 理 器 上 执行 下 述 指 令 ， 使 用 类 做 图 7-52 的 流水 线 图 ， 画 出 所 必需 的 数 
据 重 定 向 和 阻塞 。 


add $t0, $50, $sl 
sub $t0, $t0, $s2 
Iw $tl, 60($t0) 
and $t2, $tl, $t0 
对 下 述 指令 ， 重 复习 题 7. 30, 


add $t0, $s0, $s1 

Iw $tl, 60($s2) 

sub $t2, $t0, $s3 

and $t3, StL, SEQ 

对 于 流水 线 MIPS 处 理 器 ， 需 要 多 少 个 周期 才能 提交 习题 7. 23 中 的 所 有 指令 ?对 于 这 个 
程序 ， 处 理 器 CPI 是 多 少 ? 

对 习题 7. 24 中 的 所 有 指令 ， 重 复习 题 7. 32, 

解释 如 何 扩展 流水 线 MIPS 处 理 器 来 处 理 addi 指令 。 

解释 如 何 扩 展 流水 线 MIPS LPR ARSE j 指令 。 特 别 需要 注意 ， 在 跳 转 指令 发 生 时 需 
要 刷新 流水 线 。 

例 7.9 和 例 7. 10 指出 ， 在 流水 线 MIPS 处 理 需 中 ,在 执行 阶段 发 生 分 支 比 在 译 码 阶段 发 
生 要 好 。 给 出 如 何 修改 图 7-58 的 流水 线 处 理 器 以 便 在 执行 阶段 发 生 分 支 。 阻 塞 和 刷新 
信和 号 如 何 修改 ? 重新 完成 习题 7.9 和 例 7. 10 以 便 计算 新 的 CPI、 周 期 时 间 和 执行 程序 的 
总 时 间 。 

你 的 朋友 是 优秀 的 电路 设计 工程 师 。 她 提出 要 重新 设计 流水 线 MIPS 处 理 器 中 的 一 个 单 
元 来 提高 性 能 。 使 用 表 7-6 中 的 延迟 和 例 7. 10， 她 应 该 重新 设计 哪个 元 件 以 便 获 得 整个 
处 理 需 的 最 大 加 速 ? 应 该 达到 多 快 ? (如果 快 得 超过 了 所 需要 的 值 ， 就 会 浪费 你 朋友 的 
努力 。) 改 进 后 的 处 理 器 周期 时 间 为 多 少 ? 

考虑 表 7-6 中 的 延迟 和 例 7. 10。 假 设 ALU 的 速度 提高 了 20% 。 流 水 线 MIPS Mb HH aS AY ed 
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7. 41 


7. 42 
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期 时 间 应 该 如 何 变化 ?如果 ALU 慢 了 20% 呢 ? 

假设 MIPS 流水 线 处 理 器 有 10 个 阶段 ， 每 个 阶段 的 延长 为 400ps (包括 测 试 序列 时 间 开 
销 )。 假 设 使 用 例 7.7 中 的 指令 比例 。 同 时 假设 50% 的 装 入 指令 后 紧 跟着 一 条 使 用 该 装 
入 结果 的 指令 ， 这 需要 6 个 阻塞 信号 ， 并 假设 30% 的 分 支 指令 被 错误 预测 。 分 支 或 者 
跳 转 指令 的 目标 地 址 直到 流水 线 第 二 阶段 结束 才 计 算 。 计 算 使 用 这 个 10 阶段 流水 线 处 
理 器 执行 SPECINT2000 基准 测试 程序 中 1000 亿 条 指令 的 平均 CPI 和 运行 时 间 。 

为 流水 线 MIPS 处 理 器 写 HDL 代码 。 处 理 咒 应 与 HDL 例 7. 13 中 的 顶层 模块 兼容 ， 应 支 
持 本 章 中 描述 的 所 有 指令 (包括 习题 7.34 和 习题 7.35 中 的 addi 指令 和 jj 指令 ) 。 用 
HDL 例 7. 12 中 的 测试 程序 测试 你 的 设计 。 

为 流水 线 MIPS 处 理 器 设计 图 7-58 中 的 冲突 单元 。 使 用 HDL 实现 你 的 设计 。 画 出 根据 
HDL 代码 综合 工具 可 能 产生 的 硬件 原理 图 。 

不 可 屏蔽 中 断 ( nonmaskable interrupt) 由 输入 引 脚 触发 ， 并 输入 到 处 理 器 中 。 当 此 引 脚 有 
效 时 ， 当 前 指令 应 停止 执行 ， 接 着 处 理 器 将 设置 原因 寄存 器 为 0， 并 执行 异常 。 如 何 修 
改 图 7-63 和 图 7-64 中 的 多 周期 处 理 器 来 处 理 不 可 屏蔽 中 断 。 


面试 问题 
下 述 问题 在 数字 电路 设计 工作 的 面试 中 曾经 被 问 到 。 


ds 
2 


"3 
7.4 


解释 流水 线 处 理 器 的 优点 。 

如 果 增 加 流水 线 阶段 可 以 使 得 处 理 器 的 运行 速度 更 快 ， 为 什么 处 理 器 不 会 有 100 阶段 流 
水 线 ? 

摘 述 微 处 理 器 中 出 现 的 冲突 ， 并 解释 如 何 解 决 它 ” 每 种 方法 有 何 利弊 ? 

描述 超标 量 处 理 器 的 概念 以 及 其 利 刺 。 
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8.1 引言 


计算 机 解决 问题 的 能 力 受 它 的 存储 器 系统 和 输入 /输出 (IO) 设 备 
(例如 显示 器 、 键 盘 和 打印 机 ) 的 影响 ， 这 些 设备 使 我 们 可 以 操作 和 查 
看 计算 机 的 计算 结果 。 本 章 探讨 这 些 实际 存储 器 和 /O 系统 。 

计算 机 系统 的 性 能 依赖 于 处 理 器 微 体 系 结构 ， 同 时 也 依赖 于 存 
储 器 系统 。 第 7 章 假想 了 一 个 可 以 在 单 时 钟 周期 内 访问 的 理想 存储 
器 系统 。 然 而 ， 这 种 假想 只 有 在 非常 小 的 存储 器 或 非常 低速 的 处 理 
器 时 才 可 能 成 立 。 早 期 的 处 理 器 相对 较 慢 ， 存 储 器 能 跟 上 其 速度 。 
但 是 处 理 器 速度 的 增长 比 存储 器 速度 要 快 。 当 前 ， 处 理 器 速度 是 
DRAM 存储 器 速度 的 10 ~ 100 倍 。 对 于 处 理 器 和 存储 器 之 间 不 断 增 
大 的 速度 差异 ,需要 借助 于 巧妙 的 存储 器 系统 来 与 处 理 器 的 速度 匹 
配 。 本 章 的 前 半 部 分 研究 实际 的 存储 器 系统 ， 并 考虑 速度 、 容 量 和 
成 本 之 间 的 折 中 。 

处 理 器 通过 存储 器 接口 (memory interface ) 与 存储 器 系统 相连 。 
图 8-1 为 多 周期 MIPS 存储 器 中 使 用 的 简单 存储 器 接口 。 处 理 器 通过 地 








址 总 线 发 送 地 址 到 存储 器 系统 。 对 于 读 操作 ，MemWiite 为 0， 存 储 器 
理 器 通过 写 数据 总 线 WriteData 发 送 数据 到 存储 器 。 

存储 器 系统 设计 的 主要 问题 可 以 用 图 书馆 里 的 
正在 写 一 篇 以 梦 为 主题 的 学 期 报告 ， 你 可 能 去 图 书 Memwris WE) an 
馆 S， 取 出 弗 洛 伊 德 的 ( 梦 的 解释 )， 然 后 把 它 带 到 Neal = 存储 器 
后 取出 荣 格 (Jung) 的 《无 意识 心理 学 )。 之 后 你 可 能 : 
因为 一 篇 参考 文献 又 回 到 图 书馆 查阅 ( 梦 的 解释 》， ce ei 
工作 室 以 便 节省 时 间 ， 而 不 是 随身 带 着 这 些 书 。 更 进一步 ， 当 你 取出 一 本 弗 洛 伊 德 的 书 时 ， 还 
应 该 在 同一 个 书架 取出 他 编著 的 其 他 书 。 
近 最 可 能 使 用 的 书 保存 在 工作 室 ， 可 以 减少 了 来 回 奔 波 的 时 间 耗 费 。 这 里 应 用 了 时 间 局 部 性 
(temporal locality) 和 空间 局 部 性 (spatial locality) 的 原理 。 时 间 局 部 性 意味 着 如 果 你 最 近 使 用 的 


通过 读数 据 总 线 ReadData 返回 数据 。 对 于 写 操作 ，MemWrite 为 1， 处 

书 来 比喻 。 图 书馆 的 很 多 书 都 放 在 书架 上 。 如 果 你 Te 

工作 室 。 在 浏览 该 书后 ， 你 会 把 它 带 回 图 书馆 ， 然 

随 之 又 来 回 查阅 弗 洛 伊 德 的 (自我 与 本 我 )。 一 种 更 聪明 的 办 法 是 ， 把 所 有 的 书 都 保存 在 你 的 
这 个 例子 说 明了 6. 2. 1 节 所 介绍 的 应 使 常见 事件 速度 更 快 的 原则 。 将 那些 最 近 使 用 或 者 最 

一 本 书 ， 可 能 很 快 就 会 再 使 用 它 。 空 间 局 部 性 意味 着 当 你 使 用 一 本 书 时 ， 很 可 能 会 对 同一 主题 


日 ”我 们 意识 到 由 于 互联 网 的 存在 ， 图 书馆 在 高 校 学 生 中 的 使 用 率 是 直线 下 降 的 。 但 我 们 相信 图 书馆 含有 大 量 
不 可 以 电子 存 取 的 难得 的 人 类 知识 财富 。 我 们 希望 Web 搜索 不 会 完全 取代 图 书馆 检索 。 
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的 其 他 书 也 感 兴趣 。 

图 书馆 自身 也 使 用 局 部 性 原理 使 常见 事件 速度 更 快 。 图 书馆 没有 这 么 多 的 书架 空间 和 预算 
来 提供 世界 上 的 所 有 书 。 但 是 ， 它 把 一 些 不 常用 的 书 保存 在 地 下 室 中 。 而 且 ， 它 会 与 周边 的 图 
书馆 建立 馆 际 借阅 约定 ， 这 样 它 就 可 以 提供 比 其 物理 存储 量 更 多 的 书籍 。 

总 的 来 说 ， 通 过 存储 层次 化 可 以 对 最 常用 的 书 做 到 大 容量 和 快速 访问 。 最 常用 的 书 在 你 的 
工作 室 中 ; 更 多 的 书 放 在 书架 上 ; 而 其 他 更 大 一 部 分 的 可 用 书 存储 在 地 下 室 和 其 他 图 书馆 。 类 
似 地 ， 存 储 器 系统 使 用 存储 器 层次 结构 以 便 快速 访问 最 常用 的 数据 ， 同 时 也 有 容量 来 存储 大 量 
的 数据 。 

基于 这 种 层次 结构 的 存储 子 系统 已 经 在 5.5 节 中 介绍 了 。 计 算 机 内 存 基 本 上 由 动态 RAM 
(DRAM) 和 静态 RAM( SRAM) 组 成 。 理 想 的 计算 机 存储 器 系统 应 是 快速 、 大 容量 和 廉价 的 。 实 
际 上 ， 某 种 特定 内 存 只 能 具有 这 三 个 属性 中 的 两 个 : 必然 会 具有 速度 慢 、 容 量 小 或 者 昂贵 等 二 
个 缺点 之 一 。 但 是 计算 机 系统 可 以 将 一 个 快速 、 小 容量 和 廉价 的 存储 器 和 一 个 低速 、 大 容量 和 
廉价 的 存储 器 组 合 起 来 以 便 接 近 理 想 的 存储 器 系统 。 快 速 存 储 器 存储 经 常 使 用 数据 和 指令 ， 所 
以 平均 来 看 ， 存 储 器 系统 看 起 来 可 以 快速 运行 。 大 容量 的 存储 器 存储 其 余 的 数据 和 指令 ， 所 以 
总 的 容量 很 大 。 两 个 廉价 存储 器 组 合 在 一 起 比 单独 使 用 一 个 大 容量 快速 存储 器 要 便宜 很 多 。 这 
个 原则 可 以 扩展 为 使 用 增加 容量 上 且 降 低 成 本 的 存储 器 层次 结构 。 | 

计算 机 主 存 一 般 由 DRAM 芯片 构成 。2012 年 ， 一 个 典型 PC 的 主 存 包括 4 ~8GB 的 DRAM, 
DRAM 的 成 本 约 为 10 美元 每 吉 字 节 (GB) 。 在 过 去 的 30 年 中 ，DRAM 的 价格 以 每 年 大 约 25% 
的 速度 下 降 ， 存 储 器 容量 以 相同 的 速度 增加 。 所 以 PC 中 存储 器 的 总 成 本 保持 大 致 稳定 。 不 幸 
的 是 ，DRAM 的 速度 只 以 每 年 7% 增 长 ， 而 处 理 器 的 性 能 则 以 每 年 25% ~50% 增长 ， 如 图 8-2 
所 示 。 图 中 以 1980 年 的 存储 器 (DRAM ) 和 处 理 器 速度 作为 基线 。1980 年 前 后 ， 处 理 器 和 存储 
器 的 速度 是 一 样 的 。 但 是 性 能 却 从 那 时 开始 有 了 差别 ， 存 储 器 速度 开始 严重 落后 ” 。 


100 000 
10 000 
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1980 1985 1990 1995 2000 2005 2010 
年 份 


图 8-2 ”逐渐 分 离 的 处 理 和 存储 器 性 能 
(得 到 Hennessy 和 Patterson 所 著 《 计 算 机 体系 结构 : 量化 分 析 方法 》 第 5 版 许可 ) 


在 20 世纪 70 年 代 和 80 年 代 早 期 ，DRAM 的 速度 与 处 理 器 保持 一 致 ， 但 现在 却 慢 得 可 
怜 。DRAM 访问 时 间 比 处 理 器 周期 长 一 到 两 个 数量 级 (前 者 需要 几 十 纳 秒 ， 后 者 则 不 到 1 个 
纳 秒 ) 。 





O ”尽管 近年 来 单 处 理 器 性 能 近乎 保持 不 变 ， 图 8-2 显示 了 2005 ~ 2010 年 的 变化 趋势 ， 多 核 系统 的 增加 (图 中 未 
描述 ) 只 是 恶化 了 处 理 器 与 存储 器 之 间 的 性 能 差距 。 
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为 了 抵消 这 种 趋势 ， 计 算 机 将 最 常用 的 指令 和 数据 存储 在 更 快 但 更 小 的 存储 器 中 ， 这 种 存 
储 器 称 为 高 速 缓存 (cache) 。 高 速 缓存 通常 放 在 与 处 理 器 同一 芯片 的 SRAM 中 。 其 速度 与 处 理 
器 相近 ， 因 为 SRAM 比 DRAM 快 ， 并 且 片 上 存储 器 可 以 消除 片 间 传输 产生 的 兄长 延迟 。2012 
Æ, WE SRAM 的 成 本 大 约 为 10 000$/1GB， 但 高 速 缓存 的 容量 较 小 ( 千 字 节 到 数 兆 字 节 )， 所 
以 总 成 本 并 不 是 很 高 。 高 速 缓 存 可 以 存储 指令 和 数据 ， 但 是 它们 的 内 容 统 称 为 “数据 ”。 

如 果 处 理 器 需要 的 数据 在 高 速 缓存 中 可 用 ,那么 它 可 以 快速 返回 。 这 称 为 缓存 命中 (hit)。 
否则 ， 处 理 器 就 需要 从 主 存 (DRAM ) 中 获得 数据 。 这 称 为 缓存 缺失 (miss) 。 如 果 大 部 分 情况 下 
缓存 命中 ， 那 么 处 理 器 就 基本 上 不 需要 等 待 低速 的 主 存 ,平均 访问 时 间 就 会 比较 短 。 

存储 器 层次 结构 的 第 三 层 是 硬盘 ( hard drive)。 与 图 书馆 使 用 地 下 室 存储 没有 放 在 书架 上 
的 书籍 一 样 ， 计 算 机 使 用 硬盘 来 存储 不 在 主 存 中 的 数据 。2012 年 ， 一 个 使 用 磁性 存储 器 构建 
的 硬盘 驱动 (Hard Disk Drive, HDD) 价格 低 于 0.1$/GB, 访问 时 间 约 为 10ms。 其 价格 以 每 年 
60% 的 速度 下 降 ， 但 是 访问 时 间 几 乎 没有 提高 。 使 用 闪存 技术 构建 的 固态 硬盘 ( solid state 
drive，SSD) 日 益 成 为 HDD 的 常见 替代 品 。SSD 已 经 在 小 众 市 场 里 使 用 了 超过 20 年 ，2007 EÈ 
首次 进入 主流 市 场 。SSD 克服 了 HDD 的 一 些 机 械 故 障 ， 但 价格 是 HDD 的 10 FF, 1$/GB. 

硬盘 提供 了 一 个 比 主 存 实际 容量 中 更 大 的 存储 器 空间 ， 称 为 虚拟 存储 器 ( virtual memory ) 。 
如 地 下 室 的 书 一 样 ， 需 要 花费 很 长 的 时 间 访 问 虚 拟 存储 器 中 的 数据 。 主 存 ， 也 称 为 物理 存储 器 
(physical memory) ， 包 含 了 虚拟 存储 器 的 一 个 子 集 。 因 此 ， 主 存 可 以 看 作 硬 盘 中 常用 数据 的 高 
RE. 

图 8-3 总 结 了 本 章 后 面部 分 讨论 的 计算 机 系统 的 存储 器 层次 结构 。 处 理 器 首先 在 容量 小 但 
速度 快 的 高 速 缓存 中 寻找 数据 。 如 果 数 据 不 在 高 速 缓冲 中 ， 则 处 理 器 会 在 主 存 中 寻找 。 如 果 数 
据 也 不 在 主 存 中 ， 那么 处 理 器 就 会 从 容量 大 但 速度 低 的 硬盘 上 的 虚拟 存储 器 中 获取 数据 。 图 8-4 
说 明了 存储 层次 结构 中 容量 和 速度 的 权衡 ， 列 出 了 在 2012 年 技术 水 平 下 典型 的 成 本 、 访 问 时 
间 和 带宽 。 访 问 时 间 越 得 ， 速 度 越 快 。 


访问 时 间 
(ns) 





图 8-4 2012 年 ， 存 储 器 层次 结构 中 各 组 成 部 分 的 典型 特征 


8.2 节 分 析 和 存储器 系统 的 性 能 。8. 3 节 讨 论 多 种 高 速 缓存 的 组 织 方法 。8. 4 节 研 究 虚拟 存储 
器 系统 。 总 之 ， 本 章 主要 探究 处 理 器 如 何 采 用 与 访问 内 存 相 似 的 方式 来 访问 输入 /输出 设备 (如 
键盘 和 监视 器 ) 。8. 5 节 还 讨论 存储 器 映射 IO。8.6 节 讨 论 嵌 入 式 系统 的 IO 问题 ，8.7 节 描 
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述 个 人 计算 机 的 主要 IO 标准 。 


8.2 存储 器 系统 性 能 分 析 


设计 者 (和 计算 机 购买 者 ) 需 要 定量 的 方法 来 度量 存储 器 系统 的 性 能 ， 以 便 评估 不 同 选择 
下 成 本 和 收益 的 平衡 点 。 存 储 器 系统 性 能 的 度量 标准 为 : 缺失 率 (miss rate) BK P FH (hit 
rate) ， 以 及 平均 存储 器 访问 时 间 (average memory access time)。 缺 失 率 和 命中 率 的 计算 如 下 : 
> “存储 器 访问 缺失 的 次 数 ，- - 
T 总 的 存储 器 访问 次 数 TERRE 
. . KBR PAKA | : 
命中 率 Rae a | A 
计算 高 速 缓存 的 性 能 
假设 一 个 程序 有 2000 条 数据 访问 指令 ( 装 人 和 存储 ) ， 其 中 1250 条 指令 所 需要 的 数据 在 高 
速 缓存 中 可 以 找到 ， 其 余 的 750 个 数据 由 主 存 或 者 硬盘 提供 。 高 速 缓存 的 缺失 率 和 命中 率 是 
多 少 ? 
解 : 缺失 率 为 7$0/2000 =0. 375 =37.5% ， 命 中 率 为 1250/2000 =0. 625 =1 -0. 375 =62. 5% 。 < 
平均 存储 器 访问 时 间 ( Average Memory Access Time, ATAM ) 是 处 理 器 必须 等 待 存储 器 的 每 
条 装 人 和 存储 指令 平均 时 间 。 在 图 8-3 的 典型 计算 机 系统 中 ， 处 理 器 首先 在 高 速 缓存 中 查找 数 
据 。 如 果 在 高 速 缓存 中 找 不 到 ， 则 处 理 器 在 主 存 中 查找 。 如 果 在 主 存 中 也 没有 找到 ， 则 处 理 需 
访问 硬盘 上 的 虚拟 存储 器 。 因 此 ，ATAM 计算 如 下 : 
ATAM = t. FMR (ty, + MRyytvy) (8-2) 
E, tano iun All tn OP Ay es RAE. EFAA E M A AY 7) TB], MR un A MR yuu TAA 
高 速 缓存 和 主 存 的 缺失 率 。 
计算 平均 存储 器 访问 时 间 


假设 某 个 计算 机 系统 拥有 由 高 速 缓存 和 主 存 两 层 构成 的 存储 器 结构 。 根 据 表 8-1 a A 
失 率 ， 平 均 存储 器 访问 时 间 是 多 少 ? 


表 8-1 访问 时 间 和 缺失 率 


(8-1) 


存储 器 层次 访问 时 间 ( 周 期 ) 缺失 率 
高 速 缓存 1 10% 
EF 100 0% 
解 : 平均 存储 器 访问 时 间 为 1+0.1(100) =11 周期 。 < 


改进 的 访问 时 间 

11 个 周期 的 平均 存储 器 访问 时 间 意 味 着 处 理 器 对 每 一 个 实际 需要 使 用 的 数据 需要 等 待 10 
个 周期 。 为 了 将 平均 存储 器 访问 时 间 减 小 至 1. 5 个 周期 ， 高 速 缓存 缺失 率 应 为 多 少 ? 使 用 表 8- 
1 的 数据 。 

解 : 如 果 缺 失 率 为 柬 ， 则 平均 访问 时 间 为 1 + 100m。 设 置 这 个 时 间 为 1.5， 得 出 需要 的 高 
速 缓存 缺失 率 m H 0.5% 。 < 

值得 注意 的 是 ， 性 能 改进 并 不 像 看 起 来 那么 好 。 例 如 ， 存 储 器 系统 速度 提高 10 倍 并 不 一 
定 意味 着 计算 机 程序 运行 快 10 倍 。 如 果 50% 程 序 指令 是 装 和 人 和 存储 ， 则 提高 存储 器 系统 速度 
10 倍 只 意味 着 提高 程序 性 能 1. 82 倍 。 这 个 通用 原则 称 为 Amdahl 定律 (Amdahl’s law) ， 它 说 明 
只 有 在 子 系统 的 性 能 影响 占 全 部 性 能 中 大 部 分 时 ， 提 高 子 系统 性 能 的 努力 才 会 有 效果 。 
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8.3 高 速 缓存 

高 速 缓存 通常 保存 存储 器 数据 ， 其 存放 数据 字 的 数量 称 为 容量 (capacity)C。 因 为 高 速 缓存 
的 容量 比 主 存 小 ， 所 以 计算 机 系统 设计 者 必须 选择 将 主 存 的 哪个 子 集 存 放 在 高 速 缓存 中 。 

当 处 理 器 尝试 访问 数据 时 ， 它 首先 检查 高 速 缓存 中 的 数据 。 如 果 高 速 缓存 命中 ， 那 么 数据 
马上 就 可 以 使 用 。 如 果 高 速 缓存 缺失 ， 处 理 需 就 会 从 主 存 提 取 数 据 ， 然 后 把 它 放 在 高 速 缓存 以 
便 以 后 使 用 。 为 了 放置 新 的 数据 ， 高 速 缓 存 必 须 替 换 (replace) 旧 数 据 。 本 节 将 研究 高 速 缓存 设 
计 中 的 以 下 问题 : 1) 在 高 速 缓存 中 存放 哪些 数据 ? 2) 如 何在 高 速 缓存 中 寻找 数据 ? 3) 当 高 速 
缓存 满 时 ， 如 何 蔡 换 旧 数 据 来 放置 新 数据 ? 

，” 当 阅读 后 续 各 节 时 ， 要 记 住 解决 这 些 问题 的 驱动 力 是 ， 在 大 部 分 应 用 中 ， 数 据 访 问 存 在 固 
有 的 时 间 和 空间 局 部 性 。 高 速 缓存 使 用 时 间 和 空间 局 部 性 预测 下 一 步 需 要 的 数据 是 什么 。 如 果 
程序 以 随机 顺序 访问 数据 ， 那 么 它 不 会 从 高 速 缓存 中 获 益 。 

我 们 将 在 后 续 各 厄 中 ， 以 容量 (C)、 组 数 (S)、 块 大 小 (68)、 块 数 (B) 和 相关 联 度 (入 ) 来 刻 
画 高 速 缓存 。 

尽管 这 里 我 们 主要 关注 数据 高 速 缓存 的 装 人 ， 但 是 对 于 从 指令 高 速 缓存 中 取 指 令 ， 也 适用 
同样 原则 。 数 据 高 速 缓存 的 存储 操作 也 与 之 相似 ， 将 在 8. 3.4 节 讨 论 。 


8.3.1 高 速 缓存 中 存放 的 数据 


理想 的 高 速 缓存 应 能 提早 预知 所 有 处 理 器 需要 的 数据 ， 并 提前 从 主 存 中 提取 它 ， 所 以 理想 
的 高 速 缓存 的 缺失 率 为 零 。 因 为 不 可 能 精确 地 预计 将 来 所 需 的 数据 ， 所 以 高 速 缓存 必须 基于 过 
去 存储 器 访问 的 模式 来 猜测 将 来 需要 什么 数据 。 特 别 地 ， 高 速 缓存 利用 时 间 和 空间 局 部 性 来 实 
现 低 缺 失 率 。 

时 间 局 部 性 意味 着 ， 如 果 处 理 器 最 近 访 问 过 一 块 数据 ， 那 么 它 可 能 很 快 再 次 访问 这 块 数 
据 。 因 此 ， 当 处 理 器 装 入 和 存储 不 在 高 速 缓存 中 的 数据 时 ， 需 要 将 数据 从 主 存 复制 到 高 速 缓存 
中 。 随 后 对 此 数据 的 请 求 将 在 高 速 缓 存 内 命中 。 

空间 局 部 性 意味 着 ， 当 处 理 器 访问 一 块 数据 时 ， 它 很 可 能 也 访问 此 存储 位 置 附近 的 数据 。 
因此 ， 当 高 速 缓 存 从 内 存 中 提取 一 个 字 时 ， 它 也 可 以 提取 多 个 相 邻 的 字 。 这 样 的 一 组 字 称 为 高 
速 缓存 块 (cache block) 或 高 速 缓存 行 (cache line) 。 一 个 高 速 缓存 块 中 的 字数 称 为 块 大 小 (2)。 
容量 为 C 的 高 速 缓存 包含 了 B=C/b 块 。 

实际 程序 的 时 间 和 空间 局 部 性 原理 已 经 为 实验 所 验证 。 如 果 在 程序 中 使 用 了 一 个 变量 ， 那 
么 同一 变量 很 可 能 被 再 次 使 用 ， 从 而 产生 时 间 局 部 性 。 如 果 使 用 了 一 个 数组 的 元 素 ， 那 么 同 数 
组 的 其 他 元 素 也 很 可 能 被 使 用 ， 从 而 产生 空间 局 部 性 。 


8.3.2 高 速 缓存 中 的 数据 查找 


一 个 高 速 缓存 可 以 组 织 成 5 组 ， 其 中 每 一 组 有 一 个 或 者 多 个 数据 块 。 主 存 中 数据 的 地 址 和 
高 速 缓存 中 数据 的 位 置 之 间 的 关系 称 为 映射 (mapping) 。 每 一 个 内 存 地 址 都 可 以 准确 地 映射 到 
高 速 缓存 中 的 一 组 。 某 些 地 址 位 用 于 确定 哪个 高 速 缓存 组 包含 数据 。 如 果 一 组 包含 多 块 ， 那 么 
数据 可 能 包含 在 该 组 中 的 任何 一 块 内 。 

高 速 缓存 按照 组 中 块 的 数 进行 分 类 。 在 直接 映射 ( direct mapped) 高 速 缓存 内 ， 每 一 组 只 包 
含 一 块 ， 所 以 高 速 缓存 包含 了 $ =B 组 。 因 此 ， 一 个 特定 主 存 地 址 映射 到 高 速 缓 存 的 唯一 块 。 
在 N 路 组 相 联 ( N-way associative) 高 速 缓存 中 ， 每 一 组 包含 W 块 。 地 址 依然 映射 到 唯一 的 组 ， 
其 中 共有 S = B/N 组 。 但 是 这 个 地 址 对 应 的 数据 可 以 映射 到 组 中 的 任何 块 。 全 相 联 (fall associa- 
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tive) 高 速 缓存 只 有 唯一 一 组 (S=1)。 数 据 可 以 映射 到 组 内 召 块 中 的 任何 一 块 。 因 此 ， 全 相 联 
高 速 缓存 也 是 B 路 组 相 联 高 速 缓存 的 别名 。 

为 了 说 明 高 速 缓存 的 组 织 方式 , 我 们 将 考虑 32 位 地 址 和 32 位 字 的 MIPS 存储 器 系统 。 内 
存 按 字 节 寻 址 ， 每 个 字 有 4 字 节 ， 所 以 内 存 包 含 2" 个 字 ， 并 按照 字 方 式 对 齐 。 为 了 简化 ,我 
们 首先 分 析 容 量 C 为 8 个 字 , 块 大 小 5 为 1 个 字 的 高 速 缓存 ， 然 后 推广 到 更 大 的 块 。 

1. 直接 映射 高 速 缓存 

直接 映射 高 速 缓存 的 每 组 内 有 一 块 ， 所 以 其 组 数 5 等 于 块 数 B。 为 了 理解 内 存 地 址 如 何 映 
射 到 高 速 绥 存 块 ， 想 象 内 存 就 像 高 速 缓存 那样 映射 到 多 个 b 字 大 小 的 块 。 主 存 中 第 0 块 的 地 址 
映射 到 高 速 缓存 的 第 0 组 。 主 存 中 第 1 块 的 地 址 映射 到 高 速 缓存 的 第 1 A, 这样 一 直到 内 存 中 
第 中 -1 块 的 地 址 映射 到 高 速 缓存 的 第 中 -1 组 。 此 时 高 速 缓存 没有 更 多 的 块 了 ， 所 以 就 开始 循 
环 ， 内 存 的 第 中 块 映射 到 高 速 缓存 的 第 0 组 。 

图 8-5 中 用 容量 为 8 个 字 ， 块 大 小 为 1 个 字 的 直接 映射 高 速 缓存 说 明了 这 个 映射 。 高 速 缓存 
有 8 组 ,每 组 有 1 块 。 因为 地 址 是 字 对 齐 的 ， 所 以 地 址 的 最 低 两 位 总 是 为 00。 紧 接着 的 log,8 =3 
位 说 明 存 储 右 地 址 映射 到 哪 一 组 。 因 此 ， 地 址 0x00000004 ，0x00000024 ，…，0xFFFFFFE4 的 数据 
全 部 映射 到 第 1 组 ， 以 灰色 标注 。 类 似 地 ， 地 址 Ox00000010, +++, OxFFFFFFFO 的 数据 全 部 映射 到 
第 4 组 ， 以 此 类 推 。 每 一 个 主 存 地 址 都 可 以 映射 到 高 速 缓存 中 的 唯一 组 。 


地 址 
11...11111100 
11...11111000 
11...11110100 
11...11110000 [jm 
11...11101100 
11...11101000 
11...11100100 [imemlOxPRPFFPES) | 
11...11100000 














00...00100100 | mem{0x00000024] | 
00...00100000 [-mem[0x00000020] | 


00...00011100 
00...0001 1000 
00...00010100 


ig a ry Bl eget 1.1) 
ery fo SE 


mem[Ox0000001CT 
_mem[0x00000018] | 


00...00010000 [im | T] 第 4 组 (100) 
00...00001100 | mem[0x0000000C] | Ti day 
00...00001000 | mem[0x00000008] | RARER ETE! 第 2 组 (010) 


mem] 0x00000004] 
_ mem[Ox00000000] | Pp oa (000) 
2 AEF 2; 个 字 的 高 速 缓存 


图 8-5 将 主 存 映射 到 直接 映射 高 速 缓存 


00...00000100 
00...00000000 


高 速 缓存 字段 | 

对 于 图 8-5, Hott Ox00000014 的 字 映 射 到 哪 一 个 高 速 缓存 组 ? 给 出 另 一 个 映射 到 相同 组 的 
地 址 。 

解 : 因为 地 址 是 字 对 齐 的 ， 所 以 地 址 的 最 低 两 位 为 00。 后 面 的 3 位 为 010， 所 以 该 字 映 射 
到 第 5 组 。 地 址 0x34，0x54，0x74，…，0xFFFFFFF4 上 的 字 都 映射 到 这 一 组 。 4 

因为 很 多 地 址 都 映射 到 同一 组 上 ， 所 以 高 速 缓存 还 必须 保存 实际 包含 在 每 一 组 内 数据 的 地 
址 。 地 址 的 最 低 有 效 位 说 明 哪 组 包含 该 数据 。 剩 下 的 高 位 称 为 标志 (tag) ， 说 明 包含 在 组 内 的 
数据 是 多 个 可 能 地 址 中 的 哪 一 个 。 

在 我 们 先前 的 例子 中 ，32 位 地 址 的 最 低 两 位 称 为 字 节 偏 移 量 (byte offset) ， 它 说 明 字 节 在 
字 中 的 位 置 。 紧 接着 的 3 位 称 为 组 位 (set bit) ， 说 明 地 址 映射 到 哪 一 组 (一 般 来 说 ， 组 位 的 位 数 
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H logs) 。 剩 下 的 27 位 标志 位 说 明 存 储 在 特定 高 速 缓存 组 中 数据 的 存储 器 地 址 。 图 8-6 给 出 了 
地 址 0xFFFFFFF4 的 高 速 缓存 字段 。 它 映射 到 第 一 组 ， 且 所 有 标志 都 为 1。 


FH 
示 志 组 号 候 移 量 
存储 器 地 址 [0.111 1ooLL 00 


图 8-6 ”当地 址 0xFFFFFFF4 映射 到 图 8-5 中 的 高 速 缓 存 时 该 地 址 的 高 速 缓存 字段 


高 速 缓存 字段 

为 具有 1024(2") 组 和 块 大 小 为 1 个 字 的 直接 映射 高 速 缓存 确定 组 数 和 标志 位 数 。 其 中 地 
址 长 度 为 32 位 。 

解 : 一 个 有 2 组 的 高 速 缓存 的 组 位 为 log:2 =10。 地 址 中 的 最 低 两 位 为 字 节 偏 移 量 ， 剩 下 
的 32 -10 -2 =20 位 作为 标志 。 4 

有 时 (例如 计算 机 刚 启动 时 ) ， 高 速 缓存 组 没有 包含 任何 数据 。 高 速 缓存 的 每 一 组 都 有 一 个 有 
效 位 (valid bit) ， 它 说 明 此 组 是 否 包 含有 意义 的 数据 。 如 果 有 效 位 为 0， 那 么 其 内 容 就 没有 意义 。 

图 8-7 是 图 8-5 中 直接 映射 高 速 缓存 的 硬件 结构 。 高 速 缓存 由 8 表 项 SRAM 组 成 。 每 个 表 
项 (或 组 ) 包 含 一 个 32 位 数据 缓存 行 、27 位 标志 和 1 位 有 效 位 。 高 速 缓存 使 用 32 位 地 址 访问 。 
最 低 两 位 ( 字 节 偏 移 位 ) 因 为 字 对 齐 而 省 略 ， 紧 接着 的 3 位 (组 位 ) 指 明 高 速 缓存 中 的 表 项 或 组 。 
装 入 指令 从 高 速 缓存 中 读 出 特定 的 表 项 ， 检 查 标志 和 有 效 位 。 如 果 标 志 与 地 址 中 的 最 高 27 位 
相同 ， 而 且 有 效 位 为 1， 则 高 速 缓存 命中 ， 数 据 将 返回 到 处 理 器 。 和 否则 ， 高 速 缓存 发 生 缺 失 ， 
存储 器 系统 必须 从 主 存 中 取出 数据 。 


存储 器 地 址 [ | 





图 8-7 8 组 的 直接 映射 高 速 缓存 


接 映 射 高 速 缓存 的 时 间 局 部 性 
在 应 用 中 ， 循 环 是 时 间 和 空间 局 部 性 的 常见 来 源 。 使 用 图 8-7 中 的 8 表 项 高 速 缓存 ， 给 出 在 
执行 以 下 MIPS 汇编 代码 循环 后 高 速 缓存 中 的 内 容 。 假 设 高 速 缓存 的 初始 状态 为 空 。 缺 失 率 为 多 少 ? 


addi $t0, $0, 5 

loop: beq $t0, $0, done 
lw $tl, 0x4($0) 
lw $t2, OxC($0) 
Ilw $t3, 0x8($0) 
addi $t0, $t0, -l 
j loop 

done: 
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解 : 这 个 程序 包含 一 个 重复 5 次 的 循环 。 每 一 次 循环 涉及 3 次 的 内 存 访 问 ( 装 人 ) ， 最 后 总 
计 产 生 15 次 内 存 访 问 。 在 第 一 次 循环 vs 
执行 的 时 候 ， 高 速 缓存 为 空 。 必 须 分 
别 从 主 存 的 0x4、0xC、0x8 中 获取 数 “ 存储 器 地 址 
据 ， 存 放 到 高 速 缓冲 的 第 1 组 、 第 3 组 
和 第 2 组 。 然 后， 在 以 后 4 次 的 循环 执 i 1 









0 
fit, AART TRARRE, | ns 
图 8-8 显示 了 在 为 最 后 对 内 存 地 址 0x4 1 [00...00 | mem[0x00...0C] Bol 

: , A mem|[0x00...08 2H (010) 
请 求 时 高 速 缓存 内 容 。 因 为 地 址 的 高 SOO OOO Os] 第 :组 (009) 
27 位 为 0， 所 以 标志 全 为 0。 缺失 率 为 fot |__| #808 (000) 
3/15 =20% 。 < 图 8-8 直接 映射 高 速 缓存 的 内 容 

当 两 个 最 近 访 问 的 地 址 映射 到 同一 


个 高 速 缓存 块 时 ， 就 会 产生 冲突 (conflict)， 并 且 最 近 访 问 的 地 址 从 块 中 逐 出 较 前 面 的 地 址 。 直 
接 映射 高 速 缓 存 每 组 只 有 1 块 ， 所 以 两 个 映射 到 同一 组 的 地 址 和 常常 会 产生 冲突 。 例 8.7 说 明 
冲突 。 
高 速 缓 存 块 冲突 
当 在 图 8-7 中 的 8 字 直 接 映 射 高 速 缓 存 中 执行 以 下 循环 时 ， 缺失 率 是 多 少 ? 假设 高 速 缓存 
初始 为 空 。 
addi $t0, $0, 5 
loop: beq $t0, $0, done 
lw $tl, 0x4($0) 
lw $t2, 0x24($0) 
addi $t0, St, =1 


j loop 
done: 


解 : 内 存 地 址 0x4 Al 0x24 都 映射 到 第 一 组 。 在 循环 的 初始 执行 时 ， 地 址 0x4 中 的 数据 被 装 
人 高 速 缓存 的 第 一 组 。 然 后 ， 地 址 0x24 中 的 数据 被 装 人 第 一 组 ， 并 逐 出 地 址 0x4 中 的 数据 。 
在 循环 的 第 二 次 执行 时 ， 这 种 模式 重复 ,高 速 缓存 必须 重新 获取 地 址 0x4 中 的 数据 ， 逐 出 地 址 
0x24 中 的 数据 。 这 两 个 地 址 产生 冲突 ， 缺 失 率 为 100% < 

2. 多 路 组 相 联 高 速 缓存 

N 路 组 相 联 高 速 缓存 通过 为 每 组 提供 N 块 的 方式 来 减少 冲突 。 每 个 内 存 地 址 依然 映射 到 唯 
一 的 组 中 ,但 是 它 可 以 映射 到 一 组 中 图 块 的 任意 一 块 。 因 此 ， 直 接 映 射 高 速 缓存 也 称 为 单 路 组 
相 联 高 速 缓存 。N 称 为 高 速 缓存 的 相 联 度 ( degree of associative ) 。 

图 8-9 给 出 了 容量 C 为 8 个 字 ， 相 联 度 入 为 2 的 2 路 组 相 联 高 速 缓 存 的 硬件 。 高 速 缓存 现 
在 只 有 4 组 ， 而 不 是 直接 映射 高 速 缓存 的 8 组 。 因 此 ， 只 需要 log,4 =2 个 组 位 来 选择 组 ， 而 不 
是 直接 映射 高 速 缓存 的 3。 标 志 从 27 位 增加 到 28 位 。 每 组 包括 2 路 ( 相 联 度 为 2) 。 每 路 由 数 
据 块 、 有 效 位 和 标志 位 组 成 。 高 速 缓存 从 选 定 的 组 中 读 取 所 有 2 路 中 的 块 ， 检 查 标志 和 有 效 位 
来 确定 是 否 命中 。 如 果 其 中 一 路 命中 ， 复 用 器 就 从 此 路 选择 数据 。 

与 相同 容量 的 直接 映射 高 速 缓存 相 比 ， 组 相 联 高 速 缓存 的 缺失 率 一 般 比 较 低 ， 因 为 它们 的 
冲突 更 少 。 然 而 ， 因 为 增加 了 输出 复 用 器 和 额外 的 比较 器 ， 所 以 组 相 联 高 速 缓存 常常 比较 慢 ， 
成 本 也 比较 高 。 它 们 还 会 产生 另 一 个 问题 : 42 路 都 满 时 ， 选 择 哪 一 路 替换 ? 这 个 问题 将 在 
8.3.3 节 中 讨论 。 大 部 分 的 商业 系统 都 使 用 组 相 联 高 速 缓存 。 
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图 8-9 2 路 组 相 联 高 速 缓存 


组 相 联 高 速 缓存 的 缺失 率 

重复 例 8.7 的 问题 ， 使 用 图 8-9 中 8 字 2 路 组 相 联 高 速 缓存 。 

解 : 两 个 对 地 址 0x4 和 0x24 的 存储 器 访问 都 映射 到 第 一 组 。 然 而 ， 高 速 缓存 有 2 路 ， 所 以 
它 能 同时 为 两 个 地 址 提供 数据 空间 。 在 第 一 次 循环 中 ， 空 的 高 速 缓存 对 两 个 地 址 访问 都 产生 缺 
失 ， 人 然后 将 两 个 字 的 数据 装 人 第 1 组 的 2 路 第 1 路 第 0 路 
中 ， 如 图 8-10 所 示 。 在 随后 的 4 次 循环 中 ， Vy 标志 ge Vik ”数据 | 
高 速 缓存 都 命中 5 因此 使 失 率 为 '2/10 = GOL. J. | 第 组 
20% 。 例 8.7 中 相同 容量 大 小 的 直接 映射 高 oan Dl A 第 组 
速 缓存 的 缺失 率 为 100% 。 i eT ae Sa ey E E E 

3. 全 相 联 高 速 缓存 图 8-10 2 路 组 相 联 高 速 缓存 内 容 

全 相 联 高 速 缓存 只 有 一 组 ， 其 中 包含 了 B 路 (B 为 块 的 数目 ) 。 存 储 器 地 址 可 以 映射 到 这 些 
路 中 的 任何 一 块 。 全 相 联 高 速 缓存 也 可 以 称 为 下 路 单 组 组 相 联 高 速 缓存 。 

图 8-11 显示 了 包含 8 块 的 全 相 联 高 速 缓存 SRAM 阵列 。 对 于 一 个 数据 请 求 ， 由 于 数据 可 
能 在 任何 一 块 中 ， 所 以 必须 对 8 个 标志 进行 比较 (图 中 没有 表示 出 ) 。 类 似 地 ， 如 果 命 中 ， 则 使 
用 8:1 复 用 器 选择 合适 的 数据 。 对 于 给 定 的 高 速 缓 存 相 同 容量 下 ， 全 相 联 高 速 缓存 一 般 具 有 最 
小 的 冲突 缺失 ， 但 是 需要 更 多 的 硬件 用 于 标志 比较 。 因 为 需要 大 量 的 比较 器 ， 所 以 它们 仅仅 适 
合 于 较 小 的 高 速 缓存 。 


第 7 路 第 6 路 第 5 路 第 4 路 第 3 路 第 2 路 第 1 路 第 0 路 
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图 8-11 8 块 全 相 联 高 速 缓存 





4. 块 大 小 

前 面 的 例子 能 够 利用 时 间 局 部 性 ， 因 为 块 大 小 是 一 个 字 。 为 了 利用 空间 局 部 性 ， 高 速 缓存 
使 用 更 大 的 块 来 保存 多 个 连续 的 字 。 

块 大 小 大 于 工 个 字 的 优势 在 于 ， 在 发 生 缺 失 和 取出 字 放 大 高 速 缓存 中 时 ， 在 块 中 相 邻 的 字 
也 会 取出 放 和 人 高 速 缓存 中 。 因 此 ， 因 为 空间 局 部 性 ， 所 以 后 续 的 访问 就 很 可 能 命中 。 然 而 ， 对 
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于 固定 大 小 的 高 速 缓 存 ， 较 大 的 块 大 小 意味 着 块 的 数目 较 少 。 这 可 能 会 导致 更 多 的 冲突 ， 增 加 
缺失 率 。 而 且 ， 因 为 要 从 主 存 中 取出 多 于 一 个 字 的 数据 ， 所 以 在 一 次 缺失 后 需要 耗费 更 多 时 间 
来 取出 缺失 的 高 速 缓 存 块 。 将 缺失 块 装 人 高 速 缓 存 所 需 的 时 间 称 为 缺失 代价 (miss penalty ) 。 如 
果 块 中 的 相 邻 字 在 稍 后 未 被 访问 ， 那 么 用 于 取出 它们 的 工作 就 浪费 了 。 然 而 ， 大 部 分 实际 程序 
都 从 较 大 的 块 受益 。 

图 8-12 显示 了 容量 C 为 8 个 字 , 块 大 小 b 为 4 个 字 的 直接 映射 高 速 缓 存 人 硬件 。 此 时 ， 高 速 
缓存 只 有 B=C/4=2 ik, 直接 映 射 高 速 缓 存 的 每 组 中 仅 有 一 块 ， 所 以 这 个 高 速 缓存 有 两 组 ， 只 
需要 log,2 =1 位 用 于 选择 组 。 同 时 ,需要 一 个 复 用 器 来 选择 在 一 个 块 中 的 字 。 复 用 器 由 地 址 的 
块 偏 移 位 (log,4 =2 位 ) 控 制 。 最 高 的 27 位 地 址 组 成 标志 。 整 个 块 只 需要 一 个 标志 ， 因 为 块 内 
字 的 地 址 是 连续 的 。 


RA F 
标志 组 偏 移 量 偏 移 量 
| 00 





图 8-12 组 数 为 2， 块 大 小 为 4 字 的 直接 映射 高 速 缓存 


图 8-13 显示 了 为 地 址 0x8000009C 映射 到 图 8-12 中 的 直接 映射 高 速 缓存 时 的 高 速 缓存 字 
段 。 对 于 字 访 问 时 ， 字 节 偏 移 量 总 是 0。 下 一 个 log,b =2 的 块 侦 移 位 指明 此 字 在 块 中 的 位 置 。 
下 一 位 指出 组 。 剩 下 的 27 位 为 标志 位 。 因 此 ， 地 址 为 0x8000009C 的 字 映 射 到 高 速 缓存 中 第 1 
组 的 第 3 个 字 。 使 用 更 大 的 块 大 小 来 拓展 空间 局 部 性 的 原理 也 可 应 用 于 相 联 高 速 缓存 。 


块 内 字 节 
志 A 偏 移 量 偏 移 量 
00.100 J 1- E It. | 00 


800000 9 È 
K 8-13 HERAK 8-12 的 高 速 缓存 时 ， 地 址 0x8000009C 的 高 速 缓存 字段 


直接 映射 高 速 缓存 的 空间 局 部 性 

用 容量 为 8 个 字 、 块 大 小 为 4 个 字 的 直接 映射 高 速 缓存 重复 例 8. 6。 

解 : 图 8-14 显示 了 第 一 次 存储 器 访问 后 高 速 缓 存 的 内 容 。 在 第 一 次 循环 迭代 时 ， 高 速 缓 
存在 访问 存储 器 地 址 0x4 时 产生 缺失 。 这 次 访问 将 地 址 0x0 ~ 0xC 的 数据 装 人 高 速 缓存 块 中 。 
所 有 的 后 续 访 问 ( 如 地 址 OxC 所 示 ) 都 将 在 高 速 缓存 中 命中 。 因 此 ， 缺 失 率 为 1/15 = 6. 67% 。 

HA ” 字 节 


标志 ”组 偏 移 量 偏 移 量 
存储 器 地 址 [00...00010| 11 | 00 _| 








DEDS a EEN, 2 ES ES E aa 
1 | 00...00 |mem[0x00...0C]| mem[0x00...08] mem[0x00...00]| 第 0 路 


图 8-14 块 大 小 为 4 字 的 高 速 缓存 内 容 < 
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5. 小 结 

高 速 缓存 组 织 为 二 维 阵列 。 行 称 为 组 ， 列 称 为 路 。 阵 列 中 每 个 表 项 包括 一 个 数据 块 、 相 应 
的 有 效 位 和 标志 位 。 高 速 缓 存 的 关键 参数 为 : 

。 容量 C 

© 块 大 小 b( 以 及 块 数 B=C/b) 

© 一 组 内 的 块 数 (W) 

表 8-2 总 结 了 不 同类 型 的 高 速 缓存 组 织 方式 。 存 储 器 中 的 每 个 地 址 映射 到 唯一 一 组 ， 但 是 
它 可 以 存放 在 此 组 的 任何 一 路 中 。 


表 8-2 高 速 缓存 的 组 织 方式 


组 织 方式 组 数 (NN) 路 数 (5) 
直接 映射 ] B 

组 相 联 1<N<B B/N 
全 相 联 B l 


高 速 缓存 的 容量 、 相 联 度 、 组 大 小 和 块 大 小 一 般 都 是 2 HERRE. ERRERA TB 
(标志 、 组 号 和 块 内 偏 移 ) 均 为 地 址 位 的 子 集 。 

增加 相 联 度 N 通常 可 以 减少 因为 冲突 引起 的 缺失 。 但 是 高 的 相 联 度 需要 更 多 的 标志 比较 
器 。 增 加 块 的 大 小 上 ， 可 以 从 空间 局 部 性 获 益 而 减少 缺失 率 。 然 而 ， 对 于 固定 大 小 的 高 速 缓存 ， 
这 将 减少 组 数 ， 可 能 导致 更 多 的 冲突 。 同 时 ， 它 也 会 增加 缺失 代价 。 


8. 3.3 ”数据 的 替换 


在 直接 映射 高 速 缓存 中 ， 每 个 地 址 映射 到 唯一 的 块 和 组 上 。 如 果 当 必须 装 人 数据 时 一 个 组 
满 了 ， 那 么 组 中 的 块 就 必须 用 新 数据 替换 。 在 组 相 联 和 全 相 联 的 高 速 缓存 中 ， 高 速 缓存 必须 在 
组 满 时 选择 哪 一 个 块 被 替换 。 时 间 局 部 性 原则 建议 最 好 选择 最 近 最 少 使 用 的 块 ， 因 为 它 看 起 来 
最 近 最 不 可 能 再 次 用 到 。 因 此 ， 大 部 分 相 联 高 速 缓存 采用 最 近 最 少 使 用 (Least Recently Used, 
LRU ) 的 替换 原则 。 

在 2 路 组 相 联 高 速 缓存 中 ，1 位 使 用 位 (use bit) U, 说 明 组 中 的 哪 一 路 是 最 近 最 少 使 用 的 。 
每 次 使 用 其 中 一 路 ， 就 修改 U 位 来 指示 男 一 路 为 最 近 最 少 使 用 的 。 对 于 多 于 2 路 的 组 相 联 高 速 
缓存 ， 跟 踪 最 近 最 少 使 用 的 路 将 更 为 复杂 。 为 了 简化 问题 ， 组 中 的 多 路 分 成 两 部 分 (group ) ， 
而 也 指示 哪 一 部 分 为 最 近 最 少 使 用 的 。 替 换 时 ， 就 从 最 近 最 少 使 用 的 部 分 中 随机 选择 一 块 用 于 
替换 。 这 样 的 策略 称 为 伪 LRU ， 易 于 实现 。 

fl| 8. 10 最 近 最 少 使 用 蔡 换 

写 出 下 述 执行 代码 后 ， 容 量 为 8 个 字 的 2 路 组 相 联 高 速 缓存 的 内 容 。 假 设 采用 最 近 最 少 使 
用 替换 策略 ， 块 大 小 为 1 个 字 ， 初 始 时 高 速 缓存 为 空 。 

lw $t0, 0x04($0) 

lw $t1, 0x24($0) 

lw $t2, 0x54($0) 

解 : 前 两 条 指令 将 存储 器 地 址 0x4 和 0x24 中 的 数据 装 人 高 速 缓存 的 第 1 组 ， 如 图 8-15a 所 
示 。U =0 说 明 在 第 0 路 的 数据 是 最 近 最 少 使 用 的 。 下 一 次 存储 器 访问 地 址 0x54， 依 然 映射 到 
组 1， 这 将 替换 第 0 路 中 的 最 近 最 少 使 用 的 数据 。 如 图 8-15b 所 示 。 随 后 将 使 用 位 U 设置 为 1， 
说 明 第 1 路 中 的 数据 是 最 近 最 少 使 用 的 。 


[492| 
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第 0 组 (00) 


第 1 组 (01) 
第 0 组 (00) 





8-15 JH LRU 蔡 换 的 2 路 相 联 高 速 缓存 < 


8.3.4 高 级 高 速 缓 存 设 计 - 
现代 系统 使 用 多 级 高 速 缓 存 来 减少 内 存 访问 时 间 。 本 节 将 讨论 两 级 高 速 缓存 系统 的 性 能 ， 
研究 块 大 小 、 相 联 度 和 高 速 缓存 容量 对 缺失 率 的 影响 。 本 节 还 介绍 高 速 缓存 如 何 使 用 直 写 或 写 
回 策略 控制 处 理 存 储 器 存储 或 写 人 。 
1. 多 级 高 速 缓存 
大 容量 高 速 缓存 的 效果 更 好 ， 因 为 它们 更 有 可 能 保 
存 当前 需要 使 用 的 数据 ， 因 此 会 有 更 低 的 缺失 率 。 然 
而 ， 大 容量 高 速 缓存 的 速度 比 小 容量 高 速 缓存 低 。 现 代 
处 理 器 系统 常常 使 用 至 少 两 级 高 速 缓 存 ， 如 图 8-16 所 
示 。 第 一 级 (1L1) 高 速 缓存 足够 小 以 保证 访问 时 间 为 1 ~ A 
2 个 处 理 右 周期 。 第 二 级 (了 2) 高 速 缓存 常常 也 由 SRAM 
构成 , 但 比 Ll 高 速 缓存 容量 更 大 ， 因 此 速度 也 更 慢 。 
Mb Ses Bote Ll 高 速 缓 存 中 查找 数据 。 如 果 在 Ll 高 速 
缓存 中 缺失 ,那么 处 理 器 将 从 L2 高 速 缓存 中 查找 。 如 





主 存 


虚拟 存储 器 





FR 2 高速 缓存 也 缺失 ,处理 器 将 从 主 存 访问 取 数 据 。 容量 
因为 访问 主 存 的 速度 实在 太 慢 了 ， 所 以 一 些 现代 处 理 器 图 8-16 带 两 级 高 速 缓存 的 
系统 在 存储 融 层 次 结构 中 增加 了 更 多 级 的 高 速 缓存 。 存储 器 体系 结构 


带 L2 高 速 缓存 的 系统 

使 用 图 8-16 中 的 系统 ， 其 中 LI1 、L2 高 速 缓存 和 主 存 的 访问 时 间 分 别 为 1、10 和 100 个 周 
期 。 假 设 LI1、L2 高 速 缓存 的 缺失 率 分 别 为 $% 和 20%。 即 5% 的 访问 在 LI 中 缺失 ， 其 中 这 些 
的 20% FE L2 中 依然 缺失 。 那 么 平均 访问 时 间 (AMAT) 是 多 少 ? 

解 : 每 次 内 存 访问 都 检查 Ll 高 速 缓 存 。 当 Ll 高 速 缓存 缺失 时 (访问 中 的 5% ) ， 处 理 器 就 
检查 L2 高 速 缓存 。 当 L2 高 速 缓存 缺失 时 (访问 中 的 20% ) ， 处 理 器 就 从 主 存 中 获取 数据 。 使 
用 式 (8-2) ， 可 以 计算 平均 内 存 访问 时 间 为 : 1 周期 +0.05 x [10 周期 +0.2 x (100 周期 )] = 
2.5 周期 。 

L2 高 速 缓存 的 缺失 率 高 ， 因 为 它 只 接收 那些 在 LI 高 速 缓存 缺失 的 “ 硬 ” 内 存 访问 。 如 果 
所 有 的 访问 都 直接 由 L2 高 速 缓存 中 获得 ， 那 么 L2 的 缺失 率 大 约 是 1% 。 < 

2. 减少 缺失 率 

可 以 通过 改变 容量 、 块 大 小 和 相 联 度 的 方式 减少 高 速 缓存 的 缺失 率 。 减 少 缺失 率 的 第 一 步 
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是 理解 产生 缺失 的 原因 。 缺 失 可 以 分 为 强制 缺失 、 容 量 缺 失 和 冲突 缺失 。 对 高 速 缓存 块 的 第 一 
次 请 求 称 为 强制 缺失 (compulsory miss) ， 因 为 无 论 高 速 缓存 怎样 设计 ， 块 都 必须 先 从 内 存 读 取 。 
当 高 速 缓存 太 小 而 不 能 保存 所 有 并 发 使 用 的 数据 时 ， 发 生 容量 缺失 (capacity miss) 。 当 多 个 地 
址 映射 到 同一 组 而 被 替换 的 块 依然 需要 时 ， 发 生 冲 突 缺 失 (conflict miss) 。 

改变 高 速 缓存 的 参数 可 以 影响 一 种 或 更 多 种 的 高 速 缓存 缺失 。 例 如 ， 增 加 高 速 缓存 容量 可 
以 减少 冲突 和 容量 缺失 ， 但 是 不 会 影响 强制 缺失 。 另 一 方面 ， 增 加 块 大 小 可 以 减少 强制 缺失 
(因为 空间 局 部 性 ) ， 但 是 可 能 增加 冲突 缺失 (因为 更 多 的 地 址 可 能 会 被 映射 到 同一 组 中 ， 这 可 
能 会 冲突 )。 

存储 希 系 统 十 分 复杂 ， 评 估 它 们 性 能 的 最 佳 方法 是 在 不 同 的 高 速 缓存 配置 参数 下 运行 基 
准 测试 程序 。 图 8-17 描述 了 对 于 SPEC2000 基准 测试 程序 ， 高 速 缓存 容量 、 相 联 度 和 缺失 率 
的 关系 。 在 该 基准 测试 程序 中 强制 缺失 较 少 ， 用 靠近 x 轴 的 黑色 区 域 表 示 。 正 如 所 期 望 的 ， 
当 增 加 高 速 缓存 容量 时 可 以 减少 容量 缺失 。 特 别 是 对 于 小 型 高 速 缓存 来 说 ， 增 加 相 联 性 可 
以 减少 冲突 缺失 ， 如 曲线 的 顶端 所 示 。 在 4 路 或 8 路 以 上 再 增加 相 联 性 只 能 很 小 地 减少 缺 
失 率 。 

0.10 


0.09 f 
0.08 E 
0.07 


0.06 


每 种 类 型 
的 缺失 率 1 0.05 
0.04 


0.03 





0.02 


强制 缺失 


0.00 
= 8 16 32 64 128 256 512 1024 


高 速 缓存 容量 (KB) 


图 8-17 在 基准 测试 程序 SPEC2000 上 高 速 缓存 容量 、 相 联 度 和 缺失 率 的 关系 
(得 到 Hennessy 和 Patterson 所 著 的 (Computer Architecture; A Quantitative Approach, 5th), Morgan Kaufmann, 2012. 的 许可 ) 


正如 前 面 提 到 的 ， 可 以 用 增加 块 大 小 的 方法 利用 空间 局 部 性 ,减少 缺失 率 。 但 是 在 固定 大 


”小 的 高 速 缓存 中 ， 随 着 块 大 小 的 增加 ， 组 的 数量 将 减少 ， 从 而 增加 冲突 的 可 能 性 。 图 8-18 fii 


述 了 对 于 不 同 容 量 高 速 缓存 的 块 大 小 (以 字 节 为 单位 ) 与 缺失 率 之 间 的 关系 。 对 于 小 型 高 速 绥 
存 ( 如 4KB 高 速 缓存 ) ， 增 加 块 大 小 超过 人 4 字 节 会 因为 冲突 而 增加 缺失 率 。 对 于 大 型 高 速 组 
存 ， 增 加 块 大 小 超过 64 字 节 并 不 会 改变 缺失 率 。 然 而 ， 较 大 的 缺失 可 能 增加 执行 时 间 ， 因 为 
从 主 存 获 取 缺 失 的 高 速 缓存 块 需要 时 间 。 

3. 写 入 策略 

前 面 各 节 关 注 存储 器 装 人 和。 存储 器 的 存储 或 写 人 遵循 与 装 人 操作 相似 的 过 程 。 当 存储 器 存 
储 时 ， 处 理 器 检查 高 速 缓存 。 如 果 高 速 缓存 缺失 ， 就 会 将 相应 的 高 速 缓存 块 从 主 存 取 出 放 人 高 
速 缓存 中 ， 然 后 将 高 速 缓存 块 中 的 适当 字 写 和信。 如果 高 速 缓存 命中 ， 就 简单 地 将 字 写 人 高 速 缓 
存 块 中 。 


495 


314 8 E 


缺失 率 KO ee 
16K 
o 
P 0 O 64K 
0% >? 256K 


图 8-18 在 SPEC92 基准 测试 程序 上 ， 块 大 小 、 高 速 缓存 大 小 与 缺失 率 的 关系 

(得 到 Hennessy 和 Patterson 所 著 的 《Computer Architecture; A Quantitative Approach ，5th》，Morgan kaufmann, 
2012. 的 许可 ) 

高 速 缓存 可 以 分 为 直 写 达 和 写 回 两 种 方式 。 在 直 写 (write-through ) RRR, SARE 
缓存 块 的 数据 同时 写 入 主 存 。 在 写 回 (write-back ) 高速 缓存 中 ， 需 要 增加 一 位 与 每 个 高 速 缓存 
块 关 联 的 脏 位 (D)。 当 写 人 高 速 缓 存 块 时 D 设置 为 1， 其 余 情况 为 0。 只 在 脏 高 速 缓存 块 从 高 
速 缓存 中 逐 出 时 ， 才 将 它们 写 回 主 存 。 直 写 高 速 缓存 不 需要 脏 位 , 但 比 写 回 高 速 缓存 需要 更 多 
主 存 写 人 操作 。 由 于 主 存 访问 时 间 太 长 ， 所 以 现代 的 高 速 缓存 往往 采用 写 回 方式 。 

直 写 与 写 回 

假设 某 高 速 缓存 的 块 大 小 为 4 个 字 。 使 用 直 写 和 写 回 两 种 策略 ， 在 执行 以 下 代码 时 主 存 访 
问 次 数 分 别 为 多 少 ? 


sw $t0, 0x0($0) 
sw $t0, OxC( $0) 
sw $t0, 0x8($0) 
sw $t0, 0x4($0) 


解 : 所 有 4 个 存储 指令 写 同 一 个 高 速 缓存 块 。 在 直 写 高 速 缓存 中 ， 每 一 个 存储 指令 将 一 个 字 
写 人 主 存 ， 需 要 4 次 主 存 写 人 。 写 回 策略 仅仅 在 脏 高 速 缓存 块 被 逐 出 时 才 需 要 一 次 主 存 访问 。 本 


8.3.5 MIPS 高 速 缓存 的 发 展 


表 8-3 给 出 了 从 1985 ~2010 年 MIPS 处 理 髓 中 所 使 用 的 高 速 绥 存 结 构 的 发 展 。 主 要 趋势 包括 
引入 多 级 高 速 缓存 、 更 大 的 高 速 缓存 容量 、 增 加 的 相 联 度 。 产 生 这 些 趋 势 的 原因 在 于 不 断 增长 的 
CPU 频率 、 主 存 速度 和 不 断 下 降 的 晶体 管 成 本 之 间 的 不 一 致 。CPU 和 存储 器 速度 增长 的 不 同 需 要 
更 低 的 缺失 率 来 殉 服 主 存 瓶 须 ， 不 断 下 降 的 晶体 管 成 本 为 增加 高 速 缓存 的 大 小 提供 了 可 能 。 


#8-3 MIPS 高 速 缓存 的 发 展 ” 


年 份 CPU 主 频 ( MHz) Ll 高 速 缓存 L2 高 速 缓存 
1985 R2000 16. 7 none none 

1990 R3000 33 32KB 直接 映射 none 

1991 R4000 100 SKB 直接 映射 1MB 直接 映射 

1995 R10000 250 32KB 2 路 组 相 联 映射 4MB 2 路 组 相 联 映射 
2001 R14000 600 32KB 2 路 组 相 联 映射 16MB 2 路 组 相 联 映射 
2004 R16000A 800 64KB 2 路 组 相 联 映射 16MB 2 路 组 相 联 映射 
2010 MIPS32 1074K 1500 32KB 可 变 大 小 


Dià 8 D. Sweetman 所 著 的 《See MIPS Run), Morgan Kuafmann, 1999, 


8.4 EMTT 


大 部 分 现代 计算 机 系统 使 用 硬盘 (也 称 为 硬盘 驱动 右 ) 作 为 存储 器 层次 结构 中 的 最 底层 (如 
图 8-4 所 示 ) 。 与 理想 的 大 容量 、 快 速 、 廉 价 存储 器 相 比 ， 硬 盘 容 量 大 ， 价 格 便宜 ， 但 是 速度 
却 非 常 慢 。 硬 盘 比 高 成 本 效益 的 主 存 (DRAM ) 提供 了 更 大 容量 。 然 而 ， 如 果 大 部 分 的 存储 需 访 
问 需要 使 用 硬盘 ， 那 么 性 能 将 严重 下 降 。 在 PC 上 一 次 运行 太 多 程序 时 ， 就 可 能 遇 到 这 种 情况 。 

图 8-19 显示 了 一 个 掉 了 盖子 的 硬盘 驱动 占 ， 它 由 磁性 存储 器 构成 ,也 称 为 硬盘 。 顾 名 思 
义 ， 硬 盘 包 含 了 一 片 或 者 多 片 坚 硬 的 盘 片 (platter) ， 每 个 盘 片 的 长 三 角 臂 末端 都 有 一 个 读 / 写 
+ (read/write head) 。 移 动 读 / 写 头 到 盘 片 的 正确 位 置 ， 当 盘 片 在 它 下 面 旋转 时 以 磁 方 式 读 / 写 
数据 。 读 / 写 头 需要 毫秒 级 的 时 间 完 成 盘 片上 的 正确 寻 道 ， 这 对 于 人 看 来 很 快 ， 但 却 比 处 理 需 
慢 百 万 倍 。 

在 存储 器 层次 结构 中 增加 人 硬盘 的 目的 是 在 
提供 一 个 虚拟 化 的 廉价 超大 容量 存储 系统 ， 而 
且 在 大 部 分 存储 器 访问 时 ， 依然 能 提供 较 快 速 
的 存储 器 访问 速度 。 例 如 ， 一 个 只 提供 128MB 
DRAM 的 计算 机 ， 可 以 用 硬盘 高 效 提供 2GB 的 
存储 。 较 大 的 2CB 存储 器 称 为 虚拟 存储 器 (vir- 
tual memory ) ， 较 小 的 128MB 主 存 称 为 物理 存储 
器 (physical memory)。 在 本 节 中 ， 我 们 将 使 用 物 
理 存储 器 这 个 术语 来 表示 主 存 。 

程序 可 以 访问 虚拟 存储 占 中 任意 地 方 的 数 
据 ， 所 以 它们 必须 使 用 虚 地 址 (virtual address ) 
指明 其 在 虚拟 存储 器 中 的 位 置 。 物 理 存 储 上 秀 内 
保存 虚拟 存储 器 中 大 部 分 最 近 访 问 过 的 子 集 。 
这 样 ， 物 理 存储 器 充当 虚拟 存储 絮 的 高 速 绥 
存 。 因 此 ， 大 部 分 访问 将 以 DRAM 的 速度 命中 
物理 存储 器 ， 而 程序 却 可 以 使 用 更 大 容量 的 虚 204 高 速 缓存 和 虚拟 存储 器 的 相似 术语 _ 





图 8-19 硬盘 


拟 存储 器 。 A _ 
对 于 8.3 节 中 讨论 的 相同 的 高 速 缓存 原 wn 页 类 水 

理 ， 虚 拟 存储 器 系统 使 用 了 不 同 的 术语 。 表 8-4 块 偏 移 量 页 偏 移 量 

总 结 了 类 似 的 术语 。 虚 拟 存 储 器 分 为 虚 页 (vir- 缺失 页 面 失效 

tual page) ， 大 小 一 般 为 4KB。 物 理 存储 器 也 类 标志 虚 页 号 


似 地 划分 为 大 小 相同 的 物理 页 。 虚 页 可 能 在 物 
理 存储 器 (DRAM ) 中， 也 可 能 在 硬盘 上 。 例 如 ， 图 8-20 给 出 了 一 个 大 于 物理 存储 融 的 虚拟 存 
储 器 。 长 方形 表示 页 。 有 些 虚 页 在 物理 存储 器 中 ， 另 一 些 在 硬盘 上 。 根 据 虚 地 址 确定 物理 地 址 
的 过 程 称 为 地 址 转换 (address translation) 。 如 果 处 理 顺 试图 访问 不 在 物理 存储 器 中 的 虚 地 址 ， 
就 会 产生 页 面 失效 (page fault) ， 操 作 系统 将 页 从 硬盘 装 和 人 物理 存储 秦 中 。 

为 了 防止 冲突 产生 的 页 面 失效 ， 任 何 虚 页 都 可 以 映射 到 任何 物理 页 。 换 句 话 说， 物理 存储 
器 的 行为 就 像 虚拟 存储 器 的 全 相 联 高 速 缓存 。 在 常规 的 全 相 联 高 速 缓存 中 ， 每 一 个 高 速 缓存 块 
都 有 一 个 比较 器 来 比较 最 高 有 效 地 址 位 与 标志 ， 确 定 请 求 是 否 命中 块 。 在 类 似 的 虚拟 存储 售 系 
统 中 ， 每 一 个 物理 页 也 需要 一 个 比较 器 来 比较 最 高 有 效 虚拟 地 址 位 和 标志 ， 确 定 虚 页 是 否 映射 
到 物理 页 上 。 
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虚拟 地 址 地 址 转换 





硬盘 
图 8-20 ” 虚 页 和 物理 页 


现实 的 虚拟 存储 器 系统 有 很 多 物理 页 ， 对 每 一 页 提供 一 个 比较 器 的 成 本 很 高 。 作 为 代替 ， 虚 
拟 存储 右 系 统 使 用 页 表 实 现 地 址 转换 。 对 于 每 个 虚 页 页 表 都 包含 一 个 表 项 ， 说 明 它 在 物理 存储 器 
中 的 位 置 ， 或 在 硬盘 中 的 位 置 。 每 个 装 人 或 者 存储 指令 需要 首先 访问 页 表 ， 然 后 访问 物理 存储 
器 。 页 表 访 问 将 程序 使 用 的 虚 地 址 转换 为 物理 地 址 。 然 后 使 用 物理 地 址 进行 实际 的 读 或 写 数据 。 

页 表 常 常 太 大 因此 只 能 放 在 物理 存储 器 中 。 因 此 ， 每 次 装 和 或 者 存储 需要 两 次 物理 存储 右 
访问 : 第 一 次 是 访问 页 表 ; 第 二 次 是 数据 访问 。 为 了 加 速 地 址 转换 ， 转 换 后 备 缓冲 器 (Transla- 
tion Lookaside Buffer，TLB ) 绥 存 了 最 常用 的 页 表 表 项 。 

本 节 的 后 续 部 分 详细 介绍 地 址 转换 、 页 表 和 TLB。 


8. 4.1 地 址 转换 


在 包含 虚拟 存储 器 的 系统 中 ， 程 序 使 用 虚 地 址 访问 大 容量 存储 器 。 计 算 机 必须 将 虚 地 址 转 
换 以 便 找 到 物理 存储 器 中 的 地 址 ， 或 产生 一 个 页 面 缺 失 然 后 从 硬盘 获得 数据 。 

前 面 提 到 ， 虚 拟 存 储 右 和 物理 存储 器 都 分 成 页 。 虚 地 址 或 者 物理 地 址 的 最 高 有 效 位 分 别 说 
明 虚 页 号 或 物理 页 号 (page number) 。 最 低 有 效 位 说 明 页 内 字 的 位 置 ， 也 称 为 页 偏 移 量 。 

图 8-21 说 明了 包含 2GB 虚拟 存储 器 、128MB 物理 存储 右 、 页 大 小 为 4KB 的 虚拟 存储 器 系 
统 页 结构 。MIPS 处 理 器 采用 32 位 地 址 。 对 于 2GB =2 字 节 的 虚拟 存储 器 ， 只 使 用 虚拟 存储 器 
地 址 的 最 低 31 位 ,第 32 位 总 为 0。 类 似 地 ， 对 于 128MB =2 字 节 的 物理 存储 器 ， 只 使 用 物理 
地 址 的 最 低 27 位 ， 最 高 5 位 总 为 0。 
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图 8-21 物理 页 与 虚 页 


Fi tis ds Fo tagN/ 输出 系统 


因为 页 大 小 为 4KB =2° 字 节 ， 所 以 有 2 /2 = 
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2 个 虚 页 和 有 2 /2 = 2° 个 物理 页 。 因 此 ， 


虚 页 号 和 物理 页 号 分 别 为 19 位 和 AS 位 。 物 理 存 储 器 在 任何 时 间 只 能 最 多 保存 1/16 的 虚 页 。 


其 余 的 虚 页 保存 在 硬盘 上 。 

图 8-21 显示 了 虚 页 5 映射 到 物理 页 1， 虚 页 
Ox7FFFC 映射 到 物理 页 0x7FFE 等 。 例 如 ， 虚 地 址 
0x53F8( 虚 页 5 内 0x3F8 的 偏 移 量 ) 映 射 到 物理 地 
址 0x13F8( 物理 页 1 内 0x3F8 的 偏 移 量 )。 虚 地 址 
和 物理 地 址 的 最 低 12 位 是 一 样 的 (0x3F8)， 它 指 
明 虚 页 和 物理 页 内 的 页 偏 移 量 。 从 虚 地 址 到 物理 
地 址 的 转换 过 程 中 ， 只 需要 转换 页 号 。 

图 8-22 说 明了 虚 地 址 到 物理 地 址 之 间 的 转 
换 。 最 低 12 位 为 页 偏 移 量 ,不 需要 转换 。 虚 地 
址 的 最 高 19 位 为 虚 页 号 (Virtual Page Number， 
VPN) ， 可 转换 为 15 位 的 物理 页 号 (Physical Page 
Number，PPN ) 。 后 面 两 小 节 将 进一步 介绍 页 表 
以 及 如 何 使 用 TLB 实现 地 址 转换 。 

虚 地 址 到 物理 地 址 的 转换 

用 图 8-21 中 的 虚拟 存储 右 系 统 确 定 虚 地 址 
0x247C 的 物理 地 址 。 

解 : 12 位 页 偏 移 量 (0x47C ) 不 需要 转换 。 虚 
地 址 的 其 余 19 位 给 出 了 虚 页 号 ， 所 以 虚 地 址 
0x247C 应 在 虚 页 0x2 中 。 在 图 8-21 中 ， 虚 页 0x2 
映射 到 物理 页 0x7FFF。 因 此 ， 虚 地 址 0x247C HR 
射 到 物理 地 址 0x7FFF47C。 E 


8.4.2 页 表 


处 理 器 使 用 页 表 ( page table ) 将 虚 地 址 转换 
为 物理 地 址 。 对 每 一 个 虚 页 ， 页 表 都 包含 一 个 表 
项 。 表 项 包括 物理 页 号 和 有 效 位 。 如 果 有 效 位 是 
1， 则 虚 页 映射 到 表 项 指定 的 物理 页 。 和 否则 ， 虚 
页 在 硬盘 中 。 

因为 页 表 非 常 大 ， 所 以 它 需 要 存储 在 物理 存 
储 器 中 。 假 设 页 表 存 储 为 连续 数组 ， 如 图 8-23 
所 示 。 页 表 包 含 图 8-21 中 的 存储 器 系统 的 映射 。 
页 表 用 虚 页 号 (VPN ) 作为 索引 。 例 如 ， 第 5 PR 
项 说 明 虚 页 5 映射 到 物理 页 1。 第 6 个 表 项 无 效 
(V=0), 所 以 虚 页 6 在 硬盘 中 。 

使 用 页 表 实 现 地 址 转换 

使 用 图 8-23 给 出 的 页 表 找 出 虚 地 址 0x247C 
的 物理 地 址 。 

解 : 图 8-24 给 出 了 虚 地 址 0x247C 到 物理 地 
址 的 转换 。 其 中 12 位 页 偏 移 量 不 需要 转换 。 虚 


虚 地 址 





物理 地 址 
8-22 ” 虚 地 址 到 物理 地 址 的 转换 
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图 8-23 图 8-21 的 页 表 
虚 页 号 。 页 偏 移 


虚 地 址 
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图 8-24 使 用 页 表 进 行 地 址 转换 
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地 址 的 其 余 19 位 为 虚 页 号 0x2 ， 是 页 表 的 索引 。 页 表 将 虚 页 0x2 映射 到 物理 页 0x7FFF。 所 以 ， 
虚 地 址 0x247C 映射 到 物理 地 址 0x7FFF47C。 物 理 地 址 和 虚 地 址 的 最 低 12 位 是 相同 的 。 < 

页 表 可 以 存放 在 物理 存储 器 的 任何 位 置 ， 这 由 操作 系统 自由 决定 。 处 理 器 一 般 使 用 称 为 页 
表 寄 存 器 (page table register) 的 专用 寄存 器 存放 物理 存储 器 中 页 表 的 基地 址 。 

为 了 实现 装 和 信和 存储 操作 ， 处 理 器 必须 首先 将 虚 地 址 转换 为 物理 地 址 ， 然 后 访问 物理 地 址 
中 的 数据 。 处 理 器 从 虚 地 址 提取 虚 页 号 ， 将 其 与 页 表 寄 存 器 相 加 来 寻找 页 表 表 项 的 物理 地 址 。 
然后 处 理 器 从 物理 存储 器 读 取 这 个 页 表 表 项 ， 以 便 获 得 物理 页 号 。 如 果 表 项 有 效 ， 处 理 器 将 物 
理 页 号 与 页 偏 移 量 合并 ， 生 成 物理 地 址 。 最 后 ， 它 在 物理 地 址 上 读 出 或 者 写 信 数据。 因为 页 表 
存储 在 物理 存储 器 中 ， 所 以 每 次 装 入 或 者 存储 操作 都 需要 两 次 物理 存储 名 访问 。 


8. 4.3 BRERA as 


如 果 每 一 次 的 装 和 信和 存储 都 需要 页 表 ， 那 么 对 虚拟 存储 器 的 性 能 就 会 产生 严重 的 影响 ， 将 
增加 装 和 信和 存储 的 延迟 。 幸 运 的 是 ， 页 表 访 问 有 很 大 的 时 间 局 部 性 。 数 据 访问 的 时 间 和 空间 局 
部 性 ， 以 及 大 的 页 意味 着 很 多 连续 的 装 入 和 存储 操作 都 发 生 在 同一 页 上 。 因 此 ， 如 果 处 理 器 能 
记 住 它 最 后 读 出 的 页 表 表 项 ， 它 就 可 能 重用 这 个 转换 表 项 而 不 需要 重读 页 表 。 一 般 来 说 ， 处 理 
器 可 以 将 最 近 使 用 的 一 些 页 表 表 项 保存 在 称 为 转换 后 备 缓冲 器 (translation lookaside buffer, 
TLB) 的 小 型 高 速 缓存 内 。 处 理 器 在 访问 物理 存储 器 页 表 前 ， 它 首先 在 TLB 内 查找 的 转换 表 项 。 
在 实际 的 程序 中 ， 绝 大 多 数 访问 都 在 TLB 中 命中 ， 避 免 了 读 取 物 理 存 储 器 中 页 表 的 时 间 消 耗 。 
TLB 以 全 相 联 高 速 缓存 的 方式 ， 一般 有 16 ~ $12 个 表 项 。 每 个 TLB 表 项 有 一 个 虚 页 号 和 它 相应 
的 物理 页 号 。 使 用 虚 页 号 访问 TLB。 如 果 TLB 命中 ， 它 返回 相应 的 物理 页 号 ; 否则， 处 理 器 必须 从 
物理 存储 器 读 页 表 。TLB 设计 得 足够 小 使 得 它 的 访问 时 间 可 以 小 于 一 个 周期 。 即 使 如 此 ，TLB 的 命 
中 率 一 般 也 大 于 99% 。 对 于 大 多 数 装 人 和 存 取 指令 ，TLB 使 所 需 的 内 存 访问 数 从 2 次 减少 为 1 次 。 
使 用 TLB 实现 地 址 转换 


考虑 图 8-21 中 的 虚拟 存储 器 系统 。 使 用 一 个 2 表 项 TLB 完成 地 址 转换 ， 或 解释 为 什么 对 


于 虚 地 址 0x247C 和 OxSFBO 到 物理 地 址 的 转换 必须 访问 页 表 。 假 设 TLB 目前 保存 有 效 的 虚 页 
0x2 和 0x7FFFD 的 转换 内 容 。 


解 : 图 8-25 显示 了 处 理 虚 地 址 0x247C 请 求 的 2 表 项 TLB。TLB 接收 传人 地 址 的 虚 页 号 Ox2, 


将 其 与 每 一 个 表 项 的 虚 页 号 比较 。 表 项 0 匹配 且 有 效 ， 所 以 请 求 命中 。 将 匹配 表 项 的 物理 页 号 


0x7FFF 与 虚 地 址 的 页 偶 移 量 拼接 形成 转换 后 的 物理 地 址 。 与 往常 一 样 ， 页 偏 移 量 不 需要 转换 。 


虚 页 号 ”页 偏 移 量 
虚 地 址 Lox00002 | 47C | 





表 项 1 表 项 0 
eee i 
Ens ”物理 页 号 V ens ”物理 页 号 


图 8-25 使 用 2 表 项 TLB 的 地 址 转换 
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对 虚 地 址 OxSFBO 的 请 求 在 TLB 中 缺失 。 所 以 请 求 需要 转发 到 页 表 进 行 转换 。 < 


8.4.4 存储 器 保护 


到 目前 为 止 ， 本 节 都 关注 如 何 使 用 虚拟 存储 器 来 提供 一 个 快速 、 廉 价 和 大 容量 的 存储 器 。 
使 用 虚拟 存储 器 的 一 个 同样 重要 原因 是 提供 并 发 运行 程序 之 间 的 保护 。 

你 可 能 已 经 知道 ， 现 代 计 算 机 一 般 在 同一 时 间 运 行 多 个 程序 或 者 进程 。 所 有 程序 在 物理 存 
储 需 内 是 同时 存在 的 = 在 一 个 设计 良好 的 计算 机 系统 中 ， 程 序 应 当 各 自 独 立地 保护 起 来 ， 避 免 
茶 个 程序 破坏 其 他 程序 。 有 具体 地 说 ， 在 没有 得 到 允许 的 情况 下 ， 没 有 程序 可 以 访问 其 他 程序 的 
存储 空间 。 这 称 为 存储 器 保护 (memory protection) 。 

虚拟 存储 占 系 统 为 每 个 程序 提供 自己 的 虚拟 地 址 空间 (virtual address space) 来 提供 存储 器 
保护 。 每 一 个 程序 可 以 任意 使 用 自己 虚拟 地 址 空间 中 的 存储 器 ， 但 在 任 一 时 刻 只 有 部 分 的 虚拟 
地 址 空间 在 物理 存储 器 中 。 每 个 程序 可 以 使 用 它 的 所 有 虚 地 址 空间 而 无 需 担 心 其 他 程序 的 物理 
位 置 。 然 而 ， 一 个 程序 只 能 访问 已 经 映射 到 自身 页 表 中 的 物理 页 。 这 样 ， 程 序 就 不 能 意外 地 或 
者 恶意 地 访问 其 他 程序 的 物理 页 ， 因 为 它们 没有 映射 到 程序 的 页 表 中 。 在 某 些 情况 下 ， 多 个 程 
序 可 以 访问 公共 的 指令 或 者 数据 。 操 作 系 统 为 每 一 个 页 表 项 增加 控制 位 ， 以 便 决 定 哪 些 程序 可 
以 写 入 共享 的 物理 页 。 


8.4.5 替换 策略 ” 


虚拟 存储 此 系 统 使 用 写 回 和 近似 的 最 近 最 少 使 用 ( LRU ) 替换 策略 。 每 一 次 对 物理 存储 器 的 
写 都 产生 写 便 盘 的 直 写 策略 是 不 实际 的 。 如 果 采 用 直 写 策略 ， 存 储 指令 将 以 毫秒 级 的 硬盘 速度 
操作 ， 而 不 是 纳 秒 级 的 处 理 需 速度 。 在 写 回 策略 下 ， 只 有 当 物 理 页 从 物理 存储 器 替换 出 来 时 ， 
才 写 回 到 便 盘 。 把 物理 页 写 回 到 硬盘 ， 然 后 把 它 重 新 装 人 不 同 的 虚 页 称 为 分 页 (paging) ， 虚 拟 
仓储 器 系统 中 的 硬盘 有 时 称 为 交换 空间 (swap space) 。 当 出 现 页 故障 时 ， 处 理 器 从 最 近 最 少 使 
用 的 物理 页 中 换 出 ， 然 后 用 缺失 的 虚 页 蔡 换 被 换 出 的 页 。 为 了 支持 这 种 替换 策略 ， 每 个 页 表 表 
项 包含 两 个 额外 的 状态 位 : 脏 位 D 和 使 用 位 U, 

目 从 物理 页 从 硬盘 读 出 后 ， 如 果 任 何 存储 指令 修改 过 物理 页 ， 则 脏 位 设置 为 1。 当 物理 页 被 
换 出 时 ， 只 在 它 的 脏 位 为 1 时 ， 它 才 需 要 写 回 到 硬盘 。 否 则 ， 硬 盘 已 经 有 了 这 一 页 的 正确 副本 。 

如 果 物 理 页 最 近 被 访问 过 ， 那 么 使 用 位 为 1。 与 高 速 缓存 系统 一 样 ， 精 确 的 LRU 替换 将 会 寞 
常 复杂 。 实 际 上 ， 操作 系 统 使 用 近似 的 LRU 替换 策略 : 周期 性 地 重新 设置 所 有 页 表 中 的 使 用 位 为 
0。 当 一 页 被 访问 时 ， 它 的 使 用 位 设置 为 1。 在 页 面 缺 失 时 ， 操 作 系 统 寻 找 U =0 的 页 换 出 物理 存 
储 器 。 因 此 ， 操 作 系 统 不 一 定 替换 出 最 近 最 少 使 用 的 页 ， 而 只 是 其 中 一 个 最 近 最 少 使 用 页 。 


8.4.6 ZANR 


页 表 可 能 占据 大 量 的 物理 存储 器 。 例 如 ， 前 面 提 到 的 页 面 大 小 为 4KB 的 2CB ME fia a 
将 需要 2" 个 表 项 。 如 果 每 二 个 表 项 古 用 4 字 节 ;页 表 需 要 占用 2 x2 字 节 =2” 字 节 =2MB。 

为 了 节省 物理 存储 器 ， 页 表 可 以 分 为 多 级 (一 般 是 两 级 )。 第 一 级 页 表 总 是 在 物理 存储 络 
中 。 它 指明 小 的 第 二 级 页 表 在 虚拟 存储 器 中 存放 的 位 置 。 第 二 级 页 表 包 含 一 段 范围 虚 页 的 实际 
转换 内 容 。 如 果 特 定 范围 的 转换 内 容 没 有 使 用 到 ， 相 应 的 第 二 级 页 表 可 以 替换 到 硬盘 ， 而 不 需 

在 两 级 页 表 中 ， 虚 页 号 分 为 两 部 分 : 页 表 号 (page table number) Fil R #% 4m 4% E ( page table 
offset) ， 如 图 8-26 所 示 。 页 表 号 对 驻 留 在 物理 存储 器 中 的 第 一 级 页 表 进 行 寻 址 。 第 一 级 页 表 表 
项 给 出 了 第 二 级 页 表 的 基地 址 或 者 在 V 为 0 时 表示 必须 从 硬盘 获取 。 页 表 偏 移 量 对 第 二 级 页 表 
进行 寻 址 。 虚 拟 存储 器 地 址 的 其 余 12 位 为 页 偏 移 量 ， 页 大 小 为 2” =4KB。 
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(FES 页 表 偏 移 量 “页 偏 移 量 
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第 一 级 页 表 ” ”第 二 级 页 表 
图 8-26 多 级 页 表 


在 图 8-26 中 ，19 位 虚 页 号 被 分 为 9 位 的 页 表 号 和 10 位 的 页 表 偏 移 量 。 因 此 ， 第 一 级 页 表 
有 2° =512 个 表 项 。 这 512 个 第 二 级 页 表 均 有 2° = 1K 个 表 项 。 如 果 每 个 第 一 级 和 第 二 级 页 表 
表 项 占用 32 位 (4 字 节 ) ， 而 且 只 有 两 个 第 二 级 页 表 同 时 在 物理 存储 器 中 ,那么 这 个 层次 化 的 
页 表 结 构 只 使 用 了 (512 x4 字 节 ) +2 x (1K x4 字 节 ) =10KB 的 物理 存储 器 。 两 级 页 表 只 需要 
存储 全 部 页 表 的 2MB 物理 存储 器 的 一 小 部 分 。 两 级 页 表 的 缺点 是 ， 当 TLB 缺失 时 转换 过 程 将 
增加 一 次 额外 的 存储 器 访问 。 

使 用 多 级 页 表 完 成 地 址 转换 

图 8-27 为 图 8-26 所 示 的 两 级 页 表 可 能 包含 的 内 容 。 只 给 出 了 一 个 第 二 级 页 表 的 内 容 。 使 

[505] ”用 这 个 两 级 页 表 ， 描述 访问 虚 地 址 0x003FEFB0 时 发 生 了 什么 情况 。 


页 页 表 偏 移 量 _ 页 偏 移 量 
虚 地 址 





图 8-27 两 级 页 表 的 地 址 转换 
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fe: 与 往常 一 样 ， 只 有 虚 页 号 需要 转换 。 虚 地 址 的 最 高 9 位 为 页 表 号 0x0， 这 是 第 一 级 
页 表 的 索引 。 第 一 级 页 表 的 0x0 号 表 项 说 明 第 二 级 页 表 在 内 存 中 (Y=1)， 其 物理 地 址 
为 0x2375000 。 

虚 地 址 的 后 10 位 (0x3FE ) 为 页 表 偏 移 量 ， 它 给 出 了 第 二 级 页 表 的 索引 。 第 二 级 页 表 的 
表 项 0 位 于 底部 ， 表 项 0x3FF 位 于 顶部 。 第 二 级 页 表 的 第 0x3FE 号 表 项 说 明 虚 页 在 物理 存储 
右 (V=1) 中 ， 且 物理 页 号 为 0x23F1。 将 物理 页 号 和 页 偏 移 量 拼接 起 来 ， 形 成 物理 地 址 
0x23F1 FB0, 4 


8.5 I/O 简介 


输入 /输出 (IO) 系 统 用 于 连接 计算 机 与 外 部 设备 (peripherals) ， 简 称 外 设 。 在 个 人 计算 机 
中 ,这 些 设备 一 般 包 括 键盘 、 显 示 器 、 打 印 机 和 无 线 网 络 。 在 内 入 式 系统 中 ， 这 些 设备 可 能 包 
括 烤 面 包机 的 加 热 元 件 、 玩 偶 的 声音 同步 器 、 发 动机 的 燃料 注入 器 、 卫 星 的 太阳 能 面板 定位 电 
动机 等 。 处 理 器 就 像 访问 内 存 一 样 使 用 地 址 和 数据 总 线 访问 IO 设备 。 

一 部 分 的 地 址 空间 用 于 WO 设备 而 不 是 内 存 。 例 如 ，0xFFFF0000 ~ OxFFFFFFFF 的 地 址 用 
F VO, 在 6.6.1 节 中 ， 这些 地 址 是 在 存储 器 映射 的 保留 区 域 。 每 一 个 VO 设备 可 以 指定 到 这 
一 范围 中 的 一 个 或 者 多 个 地 址 。 对 特定 地 址 的 存储 操作 就 会 将 数据 发 送 给 该 设备 。 装 人 操作 就 
从 该 设备 接收 数据 。 这 种 与 VO 设备 通信 的 方式 称 为 内 存 映 射 IO(memory-mapped 1/0), 

在 具有 内 存 上 映射 IO 的 系统 中 ， 装 人 和 存储 可 能 访问 内 存 ， 也 可 能 访问 IO 设备 。 图 8-28 
给 出 了 支持 两 个 内 存 映 射 IO 设备 所 需要 的 硬件 。 地 址 译 码 器 决定 处 理 器 与 哪个 设备 进行 通 
信 ， 它 使 用 Address 和 MemWrite 信号 产生 对 其 他 硬件 的 控制 信号 。ReadData 复 用 器 在 内 存 与 各 
种 IO 设备 之 间 选 择 。 写 使 能 寄存 器 保存 写 人 IO 设备 的 值 。 
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图 8-28 ”地址 映射 VO 所 需要 的 硬件 


与 vo 设备 通信 

假设 给 图 8-28 中 的 WO 设备 1 分配 内 存 地 址 0xFFFFFFF4 。 写 出 把 值 7 写 人 LO 设备 1 和 
从 WO 设备 1 读 出 输出 值 的 MIPS 汇编 语言 。 

解 : 以 下 MIPS 汇编 代码 把 值 7 写 和 人 IO 设备 1。 


addi $t0, $0, 7 
sw $t0, OxFFF4($0) # FFF4 is sign-extended to OxFFFFFFF4 


因为 地 址 为 0xFFFFFFF4 上 且 设置 MemWrite 为 TRUE， 所 以 地 址 译 码 器 将 设置 WELA XG 


Rs 
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WriteData 总 线 上 的 值 (7) 被 写 入 与 VO 设备 1 的 输入 引 脚 相连 的 寄存 顺 中 。 
为 了 从 WO 设备 1 读 出 ， 处 理 器 应 执行 以 下 的 MIPS 汇编 代码 。 
lw $tl, OxFFF4($0) 


因为 地 址 译 码 器 检测 地 址 OxFFFFFFF4 H. Mem Write X FALSE, Prb EHE RDsel ,设置 为 
01。LO 设备 1 的 输出 通过 复 用 需 传 送 到 ReadData 总 线 ， 然 后 被 装 入 处 理 需 的 Stl 中 。 < 

与 LO 设备 通信 的 软件 称 为 设备 驱动 程序 (device driver) o WA REC A FARNE 
了 打印 机 或 者 其 他 1/0 设备 的 设备 驱动 程序 。 编 写 设备 驱动 程序 需要 详细 了 解 /0 设备 硬 
件 的 知识 。 其 他 程序 调用 设备 驱动 程序 提供 的 函数 来 访问 该 设备 ， 而 不 需 知 道 底层 的 设 
er HE 

与 VO 设备 相关 联 的 地 址 通常 称 为 0 吞 存 器 ， 因 为 它们 可 能 与 YO 设备 的 物理 寄存 器 一 
致 ， 如 图 8-28 所 示 。 

本 章 后 面 的 各 节 将 提供 IO 设备 的 具体 例子 。8.6 节 讨 论 能 入 式 系统 中 的 VO 设备 ,说 
明 如 何 使 用 基于 MIPS 的 微 探 制 硕 来 控制 许多 物理 设备 。8.7 节 讨 论 PC 中 使 用 的 主要 IO 
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BA SRR BU FIA AD PE AA Hl 5 EIRENE. RATER SEAGER BE A) g A 
元 ( MicroController Unit, MCU) Æ$, MCU 将 一 个 微 处 理 需 与 一 组 容易 使 用 的 外 围 设 备 相 结 
合 ， 例 如 ， 通 用 数字 和 模拟 IO 引 脚 、 串 行 端口 (简称 串口 ) 、 计 时 器 等 。 微 控制 器 通常 是 廉价 
的 ， 并且 通过 将 大 部 分 必要 组 件 集 成 到 单一 芯片 上 使 系统 成 本 和 尺寸 最 小 化 。 大 多 数 髋 入 式 系 
统 比 一 角 人 硬币 更 小 、 更 轻 ， 功 率 只 有 几 毫 瓦 ， 成 本 从 几 十 美 分 到 几 美 元 不 等 。 微 控制 器 根据 它 
处 理 的 数据 量 大 小 来 进行 分 类 。8 位 微 控 制 器 是 最 小 和 最 便宜 的 ， 而 32 位 微 控 制 器 则 提供 更 大 
内 存 和 更 高 性 能 。 

为 了 具体 化 ， 本 节 将 在 商业 微 控制 器 的 背景 下 介绍 组 入 式 系统 WO。 具体 地 ， 我 们 将 重点 
讨论 PIC32MX675F512H， 它 是 基于 32 位 MIPS 微 处 理 器 的 Microchip PIC32 系列 微 控制 器 。 
PIC32 系列 还 具有 丰富 种 类 的 片上 外 设 和 存储 器 ， 使 用 较 少 的 外 部 组 件 构 建 整个 系统 。 我 们 选 
择 这 个 系列 ， 因 为 它 有 价格 便宜 、 易 于 使 用 的 开发 环境 ， 它 是 基于 本 书 所 讲解 的 MIPS 体系 结 
构 ， 而 且 因 为 Microchip 是 一 家 领先 的 微 控 制 器 供应 商 ， 每 年 销售 超过 十 亿 块 芯片 。 不 同 制造 
商 生产 的 微 控 制 右 VO 系统 颇 为 相似 ， 所 以 在 PIC32 系列 中 所 阐述 的 原理 适用 于 其 他 微 控 
tl Air o 

本 节 的 其 余部 分 将 曾 述 微 控 制 器 如 何 执行 通用 的 数字 、 模 拟 和 串 行 IO 操作 。 计 时 器 通常 
用 于 生成 或 测量 精确 的 时 间 间 隔 。 本 节 最 后 以 其 他 有 趣 的 外 围 设备 ， 如 显示 右 、 电 动机 和 无 线 
链接 来 结束 。 


8.6.1 PIC32MX675F512H miz til 28 


图 8-29 展示 了 PIC32 系列 微 控 制 器 的 框图 。 该 系统 的 中 心 是 一 个 32 位 MIPS 处 理 器 。 该 处 
理 需 通过 32 位 总 线 连接 存储 程序 的 闪存 和 存储 数据 的 SRAM。PIC32MX675F512H 具有 512KB 
闪存 和 64KB RAM ， 其 他 风格 可 能 包含 16 ~512KB 闪存 和 4 ~ 128KB RAM， 根 据 不 同 价格 而 变 
化 。 高 性 能 外 设 ， 如 USB 和 以 太 网 ， 也 通过 总 线 和 矩阵 与 RAM areca 低 性 能 外 设 ， 包 括 串 
行 端口 、 计 时 器 和 A/D 转换 器 ， 共 用 一 个 独立 的 外 围 总 线 。 该 芯片 还 包含 生成 时 钟 信号 的 时 
钟 产 生 电 路 和 检测 芯片 什么 时 候 通电 或 者 将 要 断 电 的 ea 
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图 8-29 PIC32MX675F512H 框图 
(©2012 Microchip Technology Inc. 允许 转载 ) 
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MIPS 体系 结构 提供 32 位 地 址 空间 来 访问 多 达 2” 字 节 =4GB 的 内 存 ， 但 只 有 内 存 的 一 小 部 分 是 

在 芯片 上 实现 的 。 从 地 址 0xA0000000 ~ OxBFCO2FFF 的 相关 分 区 包括 RAM、 闪 存 ， 以 及 用 来 与 

外 部 设备 进行 通信 的 特殊 功能 寄存 器 (Special Function Register，SFR ) 。 需 要 注意 的 是 ， 有 一 个 

额外 的 12KB 的 引导 闪存 (Boot Flash) ， 它 通常 执行 一 些 初始 化 ， 然 后 跳 转 到 闪存 中 的 主 程序 。 

当 复 位 时 ， 将 程序 计数 器 初始 化 为 地 址 0xBFC00000 上 的 引导 闪存 的 起 始点 。 
图 8-31 展示 了 微 控制 右 的 引 脚 。 引 脚 包括 电源 和 接地 、 时 钟 、 复 位 和 多 个 用 于 通用 IO 

和 专用 外 部 设备 的 IO 引 脚 。 图 8-32 显示 了 64 引 脚 薄型 四 方 扁平 封装 (Thin Quad Flat Pack, 

TQFP) 的 微 控 制 器 照片 ， 引 脚 以 20 密 耳 (0. 02 英寸 ) 的 间隔 分 布 在 封装 四 边 。 微 控制 器 也 有 包 

含 更 多 IO 引 脚 的 100 引 脚 封装 ， 该 版 本 的 零件 编号 以 工 而 不 是 H 结束 。 
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0 x FFFFFFFF 
0 x BFC03000 
0 x BFCO2FFF 


0 x BFCO2FFO 
0 x BFCO2FEF 





人 
0 x BFC00000 引导 内 存 
0 x BF900000 
0 x BF8FFFFF 


0 x BF800000 


0 x BD080000 
0 x BDO7FFFF 


0 x BD000000 


0 x A0020000 
0 x AOO1FFFF 


0 x A0000000 


图 8-30 PIC32 内 存 映 射 
(© 2012 Microchip Technology Inc. 允许 转载 ) 
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图 8-31 PIC32MX6xxFxxH 引 脚 分 布 。 黑 色 引 脚 可 以 接受 SV 电压 
(© 2012 Microchip Technology Inc. 允许 转载 ) 
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A 8-32 64 引 脚 TQFP 封装 的 PIC32 


图 8-33 展示 了 连接 在 最 低 运行 配置 的 微 控 制 器 ， 包 括 电源 、 外 部 时 钟 、 复 位 开关 和 编程 
电缆 插 和 孔 。PIC32 和 外 部 电路 安 闭 在 印刷 电路 板 上 ， 这 个 电路 板 可 能 是 实际 的 产品 (例如 ， 一 
个 烤 面 包机 控制 嚣 ) ， 或 者 是 便于 在 测试 过 程 中 轻松 访问 芯片 的 开发 板 。 
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图 8-33 PIC32 基本 操作 电路 图 


LTC1117-3. 3 稳 压 器 可 接受 4.5~127V 的 输入 (例如 ， 从 墙 上 的 变压器 、 电 池 或 外 接 电源 , 
然后 使 其 降 到 电源 引 脚 需要 的 稳定 3.3V。PIC32 有 多 个 VDD 和 GND 引 脚 ， 通 过 提供 低 阻 抗 路 
径 来 降低 电源 噪声 。 各 种 旁 路 电容 提供 电荷 存储 ， 以 便 在 电流 需求 突然 变化 的 情况 下 保持 电源 
供应 稳定 。 一 个 旁 路 电容 也 连接 到 VCORE 引 脚 ， 该 引 脚 为 一 个 内 部 1. 8V 电压 调节 器 提供 服 
务 。PIC32 通常 从 电源 获得 1 ~2mA/MHz 的 电流 。 例 如 ， 在 80MHz 时 ， 最 大 功 耗 为 P=VI= 
(3.3V)(120mA) =0.396W。64 引 脚 TQFP 的 热 阻 为 47TC/W， 因 此 如 果 无 散热 器 或 冷却 风 肩 ， 
芯片 可 能 会 升温 至 大 约 19Y 。 

运行 频率 高 达 50MHz 的 外 部 振荡 器 可 以 连接 到 时 钟 引 脚 。 在 本 例 的 电路 中 ， 振 功 器 工作 
在 40. 000MHz。 或 者 ， 微 控制 器 可 以 编程 为 使 用 8.00MHz +2% 的 内 部 振 功 器 。 这 是 不 太 精 确 
的 频率 ， 但 也 足够 好 。L0O 设备 (如 串 行 端口 、AZD 转换 句 、 计 时 器 ) 的 外 设 总 线 时钟 (PBCLK ) 
通常 运行 在 主 系统 时 钟 (SYSCLK ) 速率 的 一 小 部 分 (例如 ， 一 半 )。 这 个 时 钟 方案 可 以 通过 在 
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MPLAB 开发 软件 设置 配置 位 ， 或 者 将 下 面 的 代码 放 在 C 程序 的 开头 。 


#pragma config FPBDIV=DIV_2 // peripherals operate at half 
// sysckfreq (20 MHz) 

#pragma config POSCMOD = EC // configureprimary oscillatorin 
// external clock mode 

#pragma config FNOSC = PRI // select the primary oscillator 


提供 复位 按钮 使 芯片 进入 操作 的 已 知 初始 状态 总 是 很 便利 的 。 复位 电路 包括 一 个 按钮 开关 
和 一 个 连接 到 复位 引 脚 (MCLR ) 的 电阻 。 复 位 引 脚 是 低 电 平 有 效 ， 它 表明 当 复 位 引 脚 为 0 时 ， 
处 理 融 复位 。 当 不 按 下 按钮 时 ， 开关 打开 ， 电 阻 拉 动 复 位 引 脚 到 1 ， 人 允许 处 理 器 正常 运行 。 当 
按 下 按钮 时 ， 开 关 关 闭 ， 复 位 引 肢 被 拉 下 到 0， 迫 使 处 理 器 复位 。 当 接 通 电源 时 ，PIC32 自动 
复位 。 

微 控 制 器 最 简单 的 编程 方法 就 是 使 用 ICD ( Microchip In 
Circuit Debugger)3， 它 亲切 地 称 为 冰球 (puck )。ICD3， 如 
图 8-34 所 示 ;， 人 允许 程序 员 从 PC 与 PIC32 通信 来 下 载 代 码 和 
调试 程序 。ICD3 连接 到 PC 上 的 USB 端口 ， 并 连接 到 PIC32 
开发 板 上 的 6 EF RJ-11 标准 连接 器 。BRJ-11 连接 器 常用 于 美国 
电话 插 孔 。ICD3 通过 双 线 电路 内 串 行 编程 接口 (In- Circuit Se- 
rial Programming interface) 与 PIC32 进行 通信 ， 串 行 编程 接口 
包含 一 个 时 钟 和 一 个 双向 数据 引 脚 。 你 可 以 使 用 Microchip 免 国 834 Microchip ICD3 
费 的 MPLAB 集成 开发 环境 (Integrated Development Environment, IDE) 编写 汇编 语言 程序 或 C 程 
序 ， 进 行 仿真 调试 ， 并 通过 ICD 下 载 到 开发 板 并 进行 测试 。 

PIC32 微 控制 器 的 大 多 数 引 脚 默认 为 通用 数字 IO 引 脚 。 因 为 该 芯片 具有 有 限 数量 的 引 脚 ， 
所 以 这 些 相 同 的 引 脚 共享 用 于 专用 IO 功能 ， 例 如 串 行 端口 、 模 拟 数字 转换 器 输入 等 ， 当 相应 
的 外 设 局 动 时 这 些 引 脚 有 效 。 程 序 员 有 责任 在 任意 时 间 内 每 个 引 脚 只 有 一 个 用 途 。8.6 节余 下 
部 分 将 详细 探索 微 控制 器 的 VO 功能 。 

微 控制 器 的 功能 远 远 超出 了 在 本 章 的 有 限 空 间 里 所 能 涵 开关 
盖 的 内 容 。 请 参见 制造 商 的 数据 手册 来 了 解 更 多 的 细节 。 尤 
其 是 ，Microchip 的 PICZ2MX5XX/6XX/7XX 系列 数据 手册 和 
PIC32 系列 参考 手册 ， 它 们 具有 权威 性 和 可 读 性 。 


8.6.2 通用 数字 MO 


通用 1/O( General- Purpose IO，GPIO ) 引 脚 用 于 读 / 写 数 
字 信 号 。 例 如， 图 8-35 展示 了 连接 到 12 位 GPIO 端口 的 8 个 
发 光 二 极 管 (Light-Emitting Diode，LED) 和 4 个 开关 。 电 路 图 
显示 端口 的 12 个 引 脚 的 名 称 和 编号 ， 它 告诉 程序 员 每 个 引 脚 
的 功能 ， 并 告诉 硬件 设计 人 员 如 何 设置 物理 连接 。 这 些 LED 
用 1 来 驱动 时 则 发 光 , 用 0 来 驱动 时 则 灭 灯 。 开 关闭 合 时 产 
生 1， 打 开 时 则 产生 0。 微 控制 器 可 以 使 用 这 个 端口 同时 驱动 
LED 并 读 取 开关 状态 。 

PIC32 将 GPIO 组 合成 同时 具备 读 / 写 功能 的 端口 。PIC32 
AY vm 4A RA, RB, RC, RD, RE, RF ARG, 简称 为 A 端 
口 、B 端口 等 。 虽 然 PIC32 没有 足够 的 引 脚 来 为 它 的 所 有 端 LED 
口 提供 信号 ， 但 每 个 端口 可 能 有 多 达 16 GPIO 引 脚 。 图 8-35 “连接 到 12 位 GPIO 端口 

每 个 端口 由 TRISx 和 PORT: 这 两 个 寄存 器 控制 ， 其 中 x 的 发 光 二 极 管 和 开关 





R=1kQ 


PIC32 
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是 表示 当前 端口 的 一 个 字母 (A ~ G)o TRIS 寄存 器 确定 端口 的 引 脚 是 输入 还 是 输出 ， 而 
PORT: 寄存 器 表明 某 个 数值 是 从 输入 读 取 还 是 驱动 到 输出 。 每 个 寄存 器 的 最 低 16 位 对 应 于 
GPIO 端口 的 16 个 引 脚 。 当 TRISx 寄存 器 的 某 个 位 为 0 时 ， 该 引 脚 是 输出 ， 而 当 它 为 1 时 ， 该 
引 脚 为 输入 。 谨 慎 的 做 法 是 将 未 使 用 的 GPIO 引 脚 设 置 为 输入 (默认 状态 ) ， 这 样 它 们 不 会 不 经 
HK A A o 

BE ay FF ais BR Ay He W A AF (OxBF80000 ~ BFSFFFF ) 特殊 功能 寄存 器 的 一 个 字 。 例 如 ， 
TRISD 映射 到 地 址 0xBF8860C0 和 PORTD 映射 到 地 址 OxBF8860D0, p32xxxx. h 头 文件 声明 这 些 
寄存 器 为 32 位 无 符号 整数 。 因 此 ， 程 序 员 可 以 通过 名 字 访 问 它 们 ， 而 不 必 查 找 对 应 的 地 址 。 

用 于 开关 和 LED 的 GPIO 


写 一 个 C 程序 读 取 4 个 开关 信号 ， 使 用 图 8-35 所 示 的 硬件 点 亮 底部 的 4 个 LED。 

解 : 配置 TRISD 使 得 引 脚 RD[7:0) 为 输出 ， 引 脚 RDL11: 8 ] 为 输入 。 然 后 通过 检查 引 脚 
RDL11:8j 读 取 开 关 信 和 号， 将 信和 号 的 值 写 回 到 RDL3:0] ， 从 而 点 亮 正确 的 LED, 

#include <p32xxxx.h> 


int main(void) { 
int switches; 


TRISD = OxFFOO; // set RDL7:0] to output, 
// RDC11:8] to input 
while (1) { 
Switches = (PORTD >> 8) & OxF; // Read and mask switches from 
// RD[11:8] 
PORTD = switches; // display on the LEDs 


| 

< 

例 8.18 立刻 写 整 个 寄存 器 。 但 访问 单个 寄存 器 位 也 是 可 以 的 。 例 如 ， 以 下 代码 把 第 一 个 
开关 的 值 复制 到 第 一 个 LED, 

PORTDbits.RDO = PORTDbits .RD8 

每 个 端口 也 有 对 应 的 SET 和 CLR 寄存 器 ， 它 们 可 以 使 用 标明 哪些 位 是 置 位 或 复位 的 掩 码 
来 写 入 。 例 如 ， 

PORTDSET = 0b0101; 

PORTDCLR = 0b1000; 
将 PORTD 的 第 一 位 和 第 三 位 置 位 ， 将 第 四 位 复位 。 如 果 PORTD 最 低 4 位 已 经 是 1110， 那 么 它 
们 将 变 为 0111 。 

可 用 的 GPIO 引 脚 数 由 封装 尺寸 决定 。 表 $ 8-5 PIC32MX5xx/6xx/7xx GPIO 引 脚 


8-5 总 结 了 各 种 封装 情况 下 的 可 用 引 脚 。 例 如 ， saa 64 引 脚 100 引 脚 TQFP， 

100 引 脚 TQFP 提供 A 端口 的 引 脚 RA[ 15: 14] 、 SN 1AL TIA GA 

RA[ 10:9] #l RA[7:0], }F#, RG[3:2] RH RA 无 15:14, 10:9, 7:0 

于 输入 。RB| 15:0] 共 享 为 模拟 输入 引 脚 ， 其 RB 15:0 15:0 

他 引 脚 也 有 多 种 功能 。 RC 15; 12 15:12, 4:0 
逻辑 电 平 是 LVCMOS 兼容 的 。 输 入 引 脚 要 RD 11:0 15:0 

RIE HF Va = 0. 15V A Vu = 0. 8V, 或 ap an Ka 


0. 5V 和 2.6V( 假 设 Vow 为 3.3V)。 只 要 输出 电 

RF 5:3: 0 13:12, 8, 5:0 
流 J. Re DAY TmA, SPARE Vo 为 
0.4V 和 Vou 为 2. 4V. RG 9:6, 3:2 15: 12, 9:63:00 
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8.6.3 #770 


如 果 微 控制 器 需要 发 送 比 可 用 GPIO 引 脚 数 更 多 的 位 ， 它 必须 把 消息 拆 分 成 多 个 较 小 的 传 
输 。 在 每 个 步骤 中 ， 它 可 以 发 送 一 位 或 多 位 。 前 者 称 为 串 行 IO， 后 者 称 为 并 行 IO。 串 行 IO 
很 普及 ， 因 为 它 使 用 较 少 的 电线 并 且 对 很 多 应 用 来 说 它 足 够 快 。 事实 上 ， 它 非常 普及 , 已 经 建 
立 了 多 个 串 行 IO 标准 ， 通 过 这 些 标准 ，PIC32 的 专用 硬件 能 方便 地 发 送 数 据 。 本 节 描 述 串 行 
外 设 接口 (Serial Peripheral Interface, SPI) 和 通用 异步 收发 大 (Universal Asynchronous Receiver/ 
Transmitter，UART) 标 准 协 议 。 

其 他 常用 串 行 标准 包括 内 部 集成 电路 (Inter- Integrated Circuit, TC)、 通 用 串 行 总 线 
(Universal Serial Bus, USB) 和 以 太 网 。 工 C 是 包含 一 个 时 钟 和 一 个 双向 数据 引 脚 的 双 线 接口 ， 
它 的 使 用 方式 与 SPI 类 似 。USB 和 以 太 网 较为 复杂 ， 高 性 能 标准 分 别 在 8.7.1 节 和 8.7.4 市 
描述 。 

1， 串 行 外 设 接口 

串 行 外 设 接口 (SPI) 是 一 个 简单 的 同步 串 行 协议 , 它 易 于 使 用 ,而且 速度 相当 快 。 物 理 接 
口 由 3 个 引 脚 组 成 : 串 行 时 钟 (Serial Clock ，SCK) 、 串 行 数据 输出 (Serial Data Qut，SDO) 和 串 
行 数 据 输入 (Serial Data In, SDI), SPI 连接 主 设 备 ( master device) 和 从 设备 (slave device), ， 如 图 
8-36a 所 示 。 主 设备 生成 时 钟 信 号 。 它 通过 在 SCK 上 发 送 一 系列 时 钟 脉冲 来 启动 通信 。 如 果 它 
想 将 数据 发 送 给 从 设备 ， 它 把 数据 从 最 高 有 效 位 开始 放 在 SDO 上 。 从 设备 通过 将 数据 放 在 主 
设备 的 SDI 可 以 同时 响应 。 图 8-36b 展示 了 8 位 数据 传输 的 SPI 波形 。 


主 设备 从 设备 





spi —< fir7 >< tis >< its >< fia >< tits >< fi >< fy io 


图 8-36 SPI 连接 和 主 设备 波形 


PIC32 有 多 达 4 个 SPI 端口 ， 命 名 为 SPII ~ SPI4。 每 个 端口 都 可 以 作为 主 设备 或 从 设备 。 
本 节 介 绍 了 主 模式 操作 ， 但 从 模式 是 相似 的 。 为 了 使 用 SPI 端口 ，PICS 程 序 必须 首先 配置 端 
口 。 然 后 ， 它 可 以 将 数据 写 人 寄存 器 ， 数 据 被 串 行 地 发 送 给 从 设备 。 可 以 使 用 另 一 个 寄存 器 收 
集 从 从 设备 接收 的 数据 。 当 传输 完成 时 ，PIC32 可 以 读 取 所 接收 的 数据 。 

每 个 SPI 端口 与 4 个 32 位 寄存 器 相关 联 : SPIxCON SPIxSTAT, SPIxBRG 和 SPIxBUF。 例 
如 ，SPIICON 是 SPI 端口 1 的 控制 寄存 器 ， 它 用 于 启动 SPI 和 设置 属性 ， 如 传输 位 数 和 时 钟 极 
性 。 表 8-6 列 出 CON 寄存 器 所 有 位 的 名 称 和 功能 。 复 位 的 默认 值 全 部 为 0。 大 部 分 的 功能 ， 如 
成 帧 、 增 强 缓 冲 、 从 设备 选择 信号 和 中 断 未 在 本 节 中 使 用 ,但 可 以 在 数据 手册 里 找到 。STAT 
是 状态 寄存 器 ， 它 指示 接收 寄存 器 是 否 已 满 。 这 个 寄存 器 的 详细 内 容 在 PIC32 数据 手册 里 有 完 
整 的 描述 。 
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表 8-6 SPIxCON 寄存 器 字段 


位 名 称 功能 

31 FRMEN 1: 使 能 成 帧 

30 FRMSYNC 帧 同步 脉冲 方向 控制 

29 FRMPOL 帧 同步 极 性 (1 = 高 电 平 有 效 ) 

28 MSSEN 1: 在 主 模式 下 使 能 从 设备 选择 生成 
27 FRMSY PW 帧 同步 脉冲 宽度 位 (1 = 1 字 宽 ,0 = 1 时 钟 周期 宽 ) 
26: 24 FRMCNT [2 :0 ] 帧 同步 脉冲 计数 器 (同步 脉冲 频率 ) 
23 MCLKSEL 主 时 钟 选择 (1 = 主 时 钟 ，0 = 外 设 时 钟 ) 
22:18 unused 

17 SPIFE 帧 同步 脉冲 边沿 选择 

16 ENHBUF 1: 使 能 增强 缓冲 

15 ON 1: SPI 启动 

14 unused 

13 SIDL 1; 在 CPU 处 于 空闲 模式 时 停止 SPI 
12 DISSDO 1: 停 用 SDO 引 脚 

11 MODE32 1: 32 位 传输 

10 MODE16 1: 16 位 传输 

9 SMP 采样 相位 (参见 图 8-39) 

8 CKE 时 钟 边 沿 ( 参 见 图 8-39) 

7 SSEN 1: 使 能 从 设备 选择 

6 CKP 时 钟 极 性 (参见 图 8-39) 

5 MSTEN 1: 使 能 从 模式 

4 DISSDI 1; 停 用 SDI 引 脚 

3:2 STXISEL [1:0] 发 送 缓冲 器 中 断 模式 

1:0 SRXISEL [1 :0] 接收 缓冲 器 中 断 模 式 


捉 行 时 钟 频率 可 以 被 配置 为 外 设 时 钟 频率 的 一 半 或 更 少 。 虽 然 SPI 在 使 用 试验 电路 板 上 的 
连 线 运 行 在 1MHz 以 上 时 可 能 会 遇 到 噪声 问题 ， 但 它 对 数据 速率 没有 理论 极限 ， 并 且 它 可 以 容 
易 地 在 印刷 电路 板 上 以 数 十 MHz 的 频率 操作 。 波 特 率 寄 存 器 (Baud Rate Register，BRGC) 根 据 下 
式 依据 外 设 时 钟 设置 SCK 速率 : 





f ipheral_ clock 
= Tl eral Cioc 8.3 
js 2 x (BRG +1) (8-33 


BUF 是 数据 缓冲 器 。 写 人 BUF 的 数据 通过 SDO 引 脚 上 的 SPI 端口 传输 ，SDI 引 脚 所 接收 的 
数据 可 以 在 传输 完成 后 通过 读 取 BUF 找到 。 

为 了 准备 SPI 主 模式 ， 首 先 通过 将 CON 寄存 器 的 第 15 位 (ON 位 ) 清除 为 0 来 将 其 关闭 。 
通过 读 取 BUF 寄存 器 来 清除 任何 可 能 在 接收 缓冲 器 中 的 数据 。 通 过 写 BRG 寄存 器 设置 所 需 的 
波 特 率 。 例 如 ， 如 果 外 设 时 钟 为 20MHz， 所 需 的 波 特 率 为 1.25MHz， 则 设置 BRG 为 [20/(2 x 
1.25) ] -1 =7。 通 过 设置 CON 寄存 器 第 5 位 (MSTEN) 为 1 把 SPI 置 于 主 模式 下 。 设 置 CON 寄 
存 器 第 8 位 (CKE ) 使 SDO 位 于 时 钟 上 升 沿 的 中 间 。 最 后 ， 通 过 设置 CON 寄存 器 ON 位 重 
启 SPI。 

为 了 发 送 数据 到 从 设备 ， 将 数据 写 入 BUF 寄存 器 。 数 据 将 串 行 传输 ， 从 设备 将 同时 将 数 
据 发 送 回 主 设备 。 等 待 直 到 STAT 寄存 器 第 11 位 (SPIBUSY 位 ) 变 为 0， 这 表明 SPI 已 完成 其 操 
作 。 然 后 ， 可 以 从 BUF 读 取 从 从 设备 接收 的 数据 。 

PIC32 上 的 SPI 端口 是 高 度 可 配置 的 ， 这 样 它 可 以 与 多 种 串 行 设备 通信 。 不 幸 的 是 ， 这 导 
致 错误 配置 端口 和 获取 乱码 数据 传输 的 可 能 性 。 时 钟 和 数据 信号 的 相对 时 序 通过 3 个 CON FF 


516 
? 


Se EE 


存 器 位 (CKP、CKE 和 SMP) 来 配置 。 默 认 情 况 下 ， 这 些 位 都 是 0， 但 图 8-36b 中 的 时 序 采用 
CKE =1。 主 设备 在 SCK 下 降 沿 改变 SDO， 因 此 从 设备 应 当 使 用 正 边沿 触发 的 触发 硕 在 其 上 升 
沿 进行 数值 采样 。 主 设备 希望 SDI 在 SCK 的 上 升 沿 保持 稳定 ， 所 以 从 设备 应 在 下 降 沿 改变 ， 如 
时 序 图 所 示 。CON 寄存 器 的 MODE32 和 MODE16 位 指定 应 该 发 送 32 位 或 16 位 字 ， 这 些 位 的 默 
认 值 都 是 0， 表 示 进 行 8 位 传输 。 

通过 SPI 发 送 和 接收 字 节 

设计 一 个 在 PIC@ 主 设备 与 FPGA 从 设备 之 
间 通 过 SPI 进行 通信 的 系统 。 画 出 接口 的 原理 
图 。 为 微 控制 器 编写 C 程序 ， 发送 字 符 “A’ 并 
接收 返回 的 字符 。 为 FPGA 上 的 SPI 从 设备 编 
写 HDL 代码 。 如 果 从 设备 只 需要 接收 数据 ， 如 
何 简化 ? 

解 : 图 8-37 展示 了 使 用 SPI 端口 2 的 设备 
之 间 的 连接 。 引 脚 号 从 器 件数 据 手册 (例如 ， Site 





Altera 
图 8-31) 获得 。 注 意图 上 显示 了 引 脚 号 和 信 PIC32MX675F512H Cyclone III FPGA 
号 名 以 便 指 明 其 物理 和 逻辑 连接 。 这 些 引 脚 也 EP3C5E144C8 


被 GPIO 端口 RG[ 8: 6 | f& FA, “4 SPI 启用 时 ， 图 8-37 PIC32 和 FPGA 之 间 的 SPI 连接 
端口 G 的 这 些 位 不 能 用 于 GPIO, 

下 面 的 C 代码 初始 化 SPI， 然 后 发 送 和 接收 一 个 字符 。 

#include <p32xxxx.h> 


void initspi(void) { 


char junk; 

SPIZCONbDits.ON =0; // disable SPI to reset any previous state 
junk = SPI2BUF; // read SPI buffer to clear the receive buffer 
SPI2BRG =7; 


SPI2CONbits.MSTEN=1; // enable master mode 
SPI2ZCONbDits.CKE=1; // set clock-to-data timing 
SPI2CONbits.0ON=1; // turn SPI on 

} 


char spi_send_receive(char send) { 


SPI2BUF = send; // send data to slave 
while (SPI2STATbits.SPIBUSY); // wait until SPI transmission complete 
return SPI2BUF; // return received data 


| 


int main(void) 1 
char received; 


initspi(); // initialize the SPI port 
received = spi_send_receive('A'); // send letter A and receive byte 
// back from slave 
} 


FPGA 的 HDL 代码 在 下 面 列 出 ， 时 序 图 如 图 8-38 所 示 。FPGA 采用 移 位 寄存 器 来 保存 从 主 
设备 接收 的 数据 位 和 仍然 要 发 送 到 主 设备 的 位 。 在 复位 后 sck 的 第 一 个 上 升 沿 和 之 后 的 每 8 个 
周期 ， 将 来 自 a 的 一 个 新 字 节 装 入 移 位 寄存 器 。 在 每 个 后 续 周 期 ， 一 个 位 数据 移 人 FPGA 的 
sdi, 一 个 位 数据 移出 FPGA 的 sdo. sdo 一 直 被 延迟 直到 sck 的 下 降 沿 ， 这 样 它 被 主 设备 在 
下 一 个 上 升 沿 采样 。 经 过 8 个 周期 后 ， 接 收 的 字 节 可 以 在 gq 内 找到 。 
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module spi_slave(input logic sck, // frommaster 
input logic sdi,- // frommaster 
output logic sdo, // to master 
input logic reset, // system reset 
input logic [7:0] d, // data to send 


output logic [7:0] q); // data received 


logic [2:0] cnt; 
logic qdelayed; 


// 3-bit counter tracks when full byte is transmitted 
always_ff @(negedge sck, posedge reset) 

if (reset) cnt =0; 

else cnt =cnt +3’ bl; 


// loadable shift register 
// loads d at the start, shifts sdi into bottom on each step 
always_ff @(posedge sck) 

q <= (cnt ==0) ? {d[6:0], sdi} : {q[6:0], sdi}; 


// align sdo to falling edge of sck 
// \oad d at the start 
always_ff @(negedge sck) 
qdelayed = q[7]; 
assign sdo = (cnt == 0) ? d[7] : qdelayed; 
endmodule 
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图 8-38 SPI 从 设备 电路 和 时 序 


如 果 从 设备 只 需要 从 主 设备 接收 数据 ， 那 么 它 简 化 为 一 个 简单 的 移 位 寄存 器 ， 见 下 面 的 
HDL 代码 。 


module spi_slave_receive_only(input logic sck, // frommaster 
input logic sdi, // frommaster 
output logic [7:0] q); // data received 


always_ff @(posedge sck) 
g <= {q[6:0], sdi}; // shift register 
endmodule <a 


3 A 人 


有 时 候 ， 有 必要 改变 配置 位 以 便 与 要 求 不 同时 序 值 的 设备 进行 通信 。 当 CKP =1 时 ，SCK 
反 转 。 当 CKE =0 时 ， 相 对 于 数据 提前 半 个 周期 进行 时 钟 切换 。 当 SAMPLE =1 时 ， 主 设备 延 
迟 半 个 周期 进行 SDI 采样 (从 设备 应 确保 它 在 那 段 时 介 里 是 稳定 的 ) 。 这 些 模 式 显 示 在 图 8-39 
中 。 要 知道 ， 不 同 的 SPI 产品 可 能 为 这 些 选 项 使 用 不 同 的 名 称 和 极 性 。 仔 细 检 查 设备 的 波形 。 
使 用 示波器 检查 SCK、SDO 和 SDI， 对 解决 通信 困难 有 帮助 。 


illa 
LL 
| Hue 


图 8-39 ”由 CKE, CKP #1 SAMPLE 控制 的 时 钟 和 数据 时 序 


2. 通用 异步 收发 器 

通用 异步 收发 硕 (UART) 是 两 个 系统 之 间 不 发 送 时 钟 信号 而 进行 通信 的 一 种 串 行 IO 外 设 。 
但 这 两 个 系统 必须 事先 就 使 用 何 种 数据 速率 达成 一 致 ， 每 个 系统 必须 生成 自己 的 时 钟 。 虽然 这 
些 系 统 时 钟 可 能 有 小 的 频率 误差 和 未 知 的 相位 关系 ,但 UART 能 保证 可 靠 的 异步 通信 。UART 
被 用 于 RS-232 和 RS-485 等 协议 中 。 例 如 ,计算 机 串口 使 用 RS-232C 标准 ， 该 标准 由 电子 工业 
协会 (Electronic Industries Association ) 于 1969 年 提出 。 该 标准 的 最 初 设想 是 连接 数据 终端 设备 
(Data Terminal Equipment, DTE) 和 数据 通信 设备 (Data Communication Equipment, DCE), ， 例 如 
计算 机 主机 和 调制 解 调 器 。 尽 管 ， 与 SPI 相 比 ，UART 相对 较 慢 ， 但 该 标准 已 经 存在 了 很 久 ， 
因而 它们 现在 仍然 重要 。 

图 8-40a 显示 了 一 个 异步 串 行 链 路 。DTE 在 TX 线 上 发 送 数据 到 DCE， 在 RX 线 上 接收 数 
据 。 图 8-40b 展示 了 在 上 述 其 中 一 条 线 上 以 9600 波 特 ( Baud) 的 数据 速率 发 送 一 个 字符 的 过 程 。 
当 链 路 空闲 时 ， 其 逻辑 为 "1 。 每 个 字符 传输 包括 一 个 起 始 位 (0) 、7 ~ 8 个 数据 位 、 一 个 可 选 
的 奇偶 位 ， 以 及 一 个 或 多 个 停止 位 (1)。UART 检测 从 空闲 状态 到 起 始 状 态 的 下 降 沿 ， 将 传输 
锁定 在 适当 的 时 间 内 。 虽 然 7 位 数据 位 足以 发 送 ASCII 字符 ， 人 得 通常 使 用 8 位 ， 因 为 这 样 可 以 
传送 任意 字 节 的 数据 。 
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图 8-40 ”异步 串 行 链 路 
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也 可 以 发 送 一 个 附加 位 (奇偶 校 验 位 )， 它 使 系统 检测 在 传输 过 程 中 是 否 有 数据 位 遭 到 损 
坏 。 它 可 以 被 配置 为 偶数 或 奇数 。 偶 校 验 意味 着 数据 和 奇偶 校 验 位 总 共有 偶数 个 1。 换 句 话 
说 ， 奇 偶 位 是 对 数据 位 进行 异 或 (XOR ) 操 作 的 结果 。 然 后 接收 器 检查 是 否 接收 到 偶数 个 1， 如 
果 没 有 则 生成 错误 信号 。 奇 校 验 则 相反 ， 因 此 奇偶 位 是 对 数据 位 进行 同 或 (XNOR ) 操作 的 
结果 。 

一 种 常见 的 选择 是 使 用 8 位 数据 位 、 无 奇偶 校 验 、1 位 停止 位 ， 总 共 10 个 符号 来 传送 一 个 
8 位 字符 信息 。 因 此 ,信号 速率 的 单位 是 波 特 而 不 是 位 / 秒 (bits/sec)。 例 如 ，9600 波 特 表示 
9600 符号 / 秒 (symbols/sec)， 或 960 字符 / 秒 (characters/sec)， 因 而 960 x8 =7680 位 / 秒 的 数据 
速率 。 两 个 传输 系统 都 必须 配置 合适 的 波 特 率 和 数据 、 奇 偶 校 验 和 停止 位 的 数量 ， 和 否则 数据 就 
会 出 现 乱 码 。 这 是 一 个 麻烦 ， 尤 其 是 对 于 非 技 术 用 户 ， 这 是 为 什么 在 PC 系统 中 通用 串 行 总 线 
(USB) 取 代 了 UART, 

常用 的 波 特 率 包 括 300、1200、2400、9600、 
14400, 19200, 38400, 57600 和 115 200。 较 低 波 
特 率 在 20 世纪 七 八 十 年 代用 于 通过 电话 线 发 送 一 
系列 音调 数据 的 调制 解 调 器 。 在 现代 系统 中 ，9600 
和 115 200 是 两 个 最 常见 的 波 特 率 。 当 对 速度 没有 
要 求 时 使 用 9600, 115 200 是 最 快 的 标准 速率 ， 虽 
然 与 其 他 现代 串 行 IO 标准 相 比 它 仍然 很 慢 。 





图 8-41 Cap’ n Crunch 水 手 口哨 
(照片 由 Evrim Sen 提供 ， 允 许 转载 ) 


RS-232 标准 定义 了 多 个 额外 的 信号 。 请 求 发 
送 ( Requestto Send, RTS) 和 清除 发 送 ( Clear to 
Send, CTS) 信号 可 用 于 硬件 握手 (hardware hand- 
shaking) 。 它 们 可 以 在 以 下 两 种 模式 的 任意 一 种 模 
式 下 工作 。 在 流 控 制 模 式 (flowcontrol mode) 下 ， 当 
DTE 准备 从 DCE 接收 数据 时 ，DTE 清除 RTS 为 0 
时 。 同 样 ， 当 DCE 准备 从 DTE 接收 数据 时 ，DCE 
清除 CTS 为 0 时。 有 些 数据 手册 使 用 上 划 线 来 表示 
它们 是 低 电 平 有 效 。 在 较 老 的 单 工 模式 下 ， 当 DTE 
准备 发 送 数 据 时 ，DTE 清除 RTS 为 0 时 。 当 DCE 
准备 接收 数据 时 ，DCE 通过 清除 CTS 回复 DTE。 

有 些 系 统 ， 特 别 是 那些 通过 电话 线 连 接 的 系 
统 , 还 使 用 数据 终端 就 绪 ( Data Terminal Ready, 
DTR). 、 数 据 载 波 检 测 ( Data Carrier Detect, DCD) 、 
数据 集 就 绪 ( Data SetReady, DSR) 和 环 指 示 符 (Ring 
Indicator，RI) 来 指示 设备 何 时 连接 到 线路 。 

最 初 的 标准 推荐 了 大 的 25 针 DB-25 xe Bear, 
但 PC 简化 为 一 个 9 针 DE-9 公 连 接 器 ， 它 的 引 脚 如 
图 8-42a 所 示 。 电 缆 线 通常 直接 连接 如 图 8-42b 所 
示 。 但 是 ， 如 果 直 接连 接 两 个 DIE， 可 能 需要 图 8-42c 
所 示 的 零 调制 解 调 器 (null modem ce) HLA, HAC 
RX 和 TX 以 便 完 成 握手 。 有 些 连接 胡 是 公 连 接 靛 ， 
而 有 些 是 母 连接 器 。 总 之 ， 可 能 要 使 用 一 大 箱 电缆 
和 一 定量 的 推测 工作 才能 通过 RS-232 连接 两 个 系 
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统 ， 再 次 说 明 转 向 USB KOE. SIEM, RASA SH Ea ey 3 或 5 导线 设 
置 ， 它 由 GND, TX, RX 组 成 ， 可 能 包括 RTS 和 CTS, 

RS-232 使 用 3 ~15V 电压 表示 0, 使 用 -3 ~ -15V 电压 表示 1。 这 就 是 所 谓 的 双 极 信号 
(bipolar signaling) 。 收 发 器 将 UART 的 数字 逻辑 电 平 转换 为 RS-232 所 要 求 的 正 / 负 电 平 ， 并 且 还 
提供 静电 放电 保护 ， 在 用 户 插 入 电缆 时 保护 串口 免 受 损 坏 。MAX3232E 是 与 3.3V 和 5V 数字 逻辑 
兼容 的 收发 器 。 它 包含 一 个 与 外 部 电容 相 结合 的 电荷 泵 ， 从 单一 低 电 压 电源 产生 +5V 输出 。 

PIC32 有 6 个 UART, 命名 为 U1 ~ U6, 与 SPI 一 样 ，PICS 程 序 必须 首先 配置 端口 。 与 SPI 
不 同 的 是 , 读 取 和 写 入 可 以 独立 操作 ， 因 为 两 个 系统 都 是 只 发 送 不 接收 ,反之 亦 然 。 每 个 
UART 与 5 个 32 位 寄存 器 关联 :UxMODE、UxSTA (状态 )、UxBRG、UxTXREG 和 UxRXREG, 
例如 ，U1MODE 是 UART 的 模式 寄存 器 。 模 式 寄 存 器 用 于 配置 UART，STA 寄存 器 用 于 检查 数 
据 是 否 可 用 。BRG 寄存 器 用 于 设置 波 特 率 。 数 据 通 过 写 人 TXREG 或 读 取 RXREG 来 完成 发 送 
或 接收 。 

模式 寄存 器 (MODE ) 默 认为 8 位 数据 位 、1 位 停止 位 、 无 奇偶 校 验 和 没有 RTS/CTS 流 控 制 
信和 号， 所 以 大 多 数 应 用 程序 员 只 对 第 15 位 (ON fiz, UART 使 能 位 ) 感 兴趣 。 

STA 寄存 器 包含 使 能 发 送 和 接收 引 脚 的 位 ， 也 包含 检查 发 送 和 接收 缓冲 器 是 否 已 满 的 位 。 
设置 UARTON 位 后 ,程序 员 还 必须 设置 STA 寄存 器 的 UTXEN 和 URXEN 位 (第 10 位 和 第 12 
位 ) 来 使 能 这 两 个 引 脚 。UTXBF( 第 9 位) 指示 发 送 缓冲 器 已 满 。 URXDA( 第 0 位) 表明 接收 缓冲 
器 具有 可 用 的 数据 。STA 寄存 器 还 包含 表示 奇偶 校 验 和 帧 错误 的 位 。 如 果 起 始 或 停止 位 没有 在 
预期 时 间 内 找到 ; 则 发 生 帧 错误 。 


16 位 BRG 寄存 只 用 于 将 波 特 率 设置 为 外 部 表 8-7 20MHz 外 部 时 钟 的 BRG 设置 


总 线 时 钟 的 一 部 分 。 目标 波 特 率 BRG ”实际 波 特 率 误差 
f ical! ined 300 4166 300 0. 0% 

four = 16 x (BRG +1) (8-4) 1200 1041 1200 0. 0% 

表 8-7 列 出 了 常用 目标 波 特 率 的 BRG 设 置 ,= wa os 0 
假设 有 一 个 20MHz 的 外 部 时 钟 。 有 时 不 可 能 正好 eo w aa ess 
达到 目标 波 特 率 。 然 而 ， 只 要 频率 误差 远 小 于 38 400 32 37 879 ~1.4% 
5% ， 那 么 可 以 在 一 个 10 位 帧 的 持续 时 间 内 保持 57 600 21 56 818 -1.4% 


发 冉 闫 和 接收 旨 之 间 的 小 相位 误差 ， 以 便 接 收 正 


115 200 


10 


113 636 


-1.4% 


确 的 数据 。 然 后 ， 系 统 将 在 下 一 个 起 始 位 重新 同步 。 

为 了 传输 数据 ， 等 待 直 到 STA. UTXBF 清空 ， 这 表明 发 送 缓冲 器 有 可 用 的 空间 ， 然 后 写 人 
字 节 到 TXREG。 为 了 接收 数据 ， 检 查 STA. URXDA ， 看 数据 是 否 已 经 接收 ， 然 后 从 RXREG 读 
WFH. 

与 PC 的 串 行 通 信 

开发 PIC32 与 PC 通信 的 电路 和 C 程序 ， 通 过 包含 8 位 数据 位 、1 位 停止 位 和 无 奇偶 校 验 
的 串 行 端 口 以 115 200 波 特 率 进行 通信 。PC 运行 控制 台 程序 ， 如 PuTTY ”， 通 过 串 行 端口 进行 
读 写 /操作 。 该 程序 要 求 用 户 输入 一 个 字符 串 ， 然 后 告诉 用 户 她 输入 了 什么 。 

解 : 图 8-43 展示 了 串 行 链 路 的 电路 图 。 因 为 几乎 没有 PC 仍然 有 物理 串 行 端口 ， 所 以 我 们 
使 用 可 插入 式 USB 到 RS-232 DBO 串 行 适配器 (参见 Plugable. com), ， 如 图 8-44 所 示 ， 提 供 
一 个 到 PC 的 串 行 连接 。 将 适配器 连接 到 一 个 母 DE-9 连接 器 上 ， 该 连接 器 焊接 到 馈 人 收发 器 


WERE, HIR RS-232 电 平 的 电压 转换 为 PIC32 微 控 制 器 的 3. 3V 电 平 。 在 这 个 例子 中 , 我 


© PuTTY 可 在 www. putty. org 免费 下 载 。 
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们 选择 PIC32 上 的 UART2 端口 。 微 控制 器 和 PC 都 是 数据 终端 设备 ， 所 以 TIX 和 RX 引 脚 在 电 
路 中 必须 是 交叉 连接 的 。 不 使 用 PIC32 RTS/CTS 握手 ， 将 DEO 连接 器 上 的 RTS 和 CTS 连接 在 
一 起 ， 使 得 PC 自己 完成 握手 。 


可 插入 USB 
oe 母 DE-9 到 RS-232 的 
ron Ekas 串 行 适配器 








16 VDD 
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图 8-43 PIC32 到 PC 的 串 行 链 路 


为 了 配置 PuTTY 使 用 串 行 链 路 工作 ,设置 连接 类 型 为 串 行 ， 速度 为 115 200。 设 置 到 操作 
系统 分 配 的 COM 端口 的 串 行 线路 为 串口 到 USB 适配器 (Serial to USB Adapter) 。 在 Windows $È 
作 系 统 中 ， 这 可 以 在 设备 管理 中 找到 。 例 如 ， 它 可 能 是 COM3。 在 连接 一 串口 选项 卡 中 ， 设 置 
流 控 制 为 NONE 或 RTS/CTS。 在 终端 选项 卡 中 ,设置 本 地 回 显 
为 强制 开 ， 从 而 在 终端 上 显示 你 键 人 的 字符 。 

该 代码 如 下 所 示 。 和 终端 程序 中 的 回 车 ( Enter) XMF C H 
言 中 的 回 车 符 ， 称 为 ' \xw'， 它 的 ASCII 码 是 0X0D。 为 了 在 输出 
时 跳 到 下 一 行 的 开头 ， 同 时 发 送 ' nn' 和 ' \r' (新 一 行 和 回 车 ) 图 8-44 可 插入 USB 到 RS-232 
字符 。 DBO 的 串 行 适配器 

初始 化 和 读 / 写 串口 的 函数 构成 了 一 个 简单 的 设备 驱动 程序 。 设 备 驱 动 程序 为 程序 员 和 便 
件 之 间 提 供 了 抽象 和 模块 化 层次 ， 使 用 设备 驱动 程序 的 程序 员 不 需要 了 解 UART 的 寄存 器 集 。 
它 还 简化 了 将 代码 移植 到 不 同 微 控制 器 的 过 程 。 设 备 驱动 程序 必须 重 写 ， 但 调用 它 的 代码 可 以 
保持 不 变 。 

main 函数 证 明了 如 何 使 用 putstrserial 和 getstrserial 函数 输出 到 控制 台 和 从 控制 
台 读 取 数 据 。 它 还 证 明了 如 何 使 用 stdio. h 中 的 printf 函数 自动 通过 UART2 输出 。 不 地 的 
是 ，PIC32 库 目 前 不 能 优雅 地 支持 在 UART 上 使 用 scanf 函数 ,但 使 用 getstrserial 足够 了 。 


#include <P32xxxx.h> 
#include <stdio.h> 





void inituart(void) { 


U2STAbDits.UTXEN=1; // enable transmit pin 
U2STAbits.URXEN = 1; // enable receive pin 
U2BRG = 10; // set baud rate to 115.2k 
U2MODEbits.ON=1; // enable UART 


| 


char getcharserial(void) | 
while (!U2STAbits.URXDA); // wait until data available 


O ” 当 ' \x' 被 省 略 时 ，PuTTY 也 可 以 正确 输出 。 
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return U2RXREG; // return character received from 
// serial port 


void getstrserial(char *str) { 


int i = 0; 

do { // read an entire string until detecting 
str[i] =getcharserial(); // carriage return 

} while (strLi++] !='\r’); // look for carriage return 

strlLi-1] =0; // null-terminate the string 


} 


void putcharserial(charc) 1 
while (U2STAbits.UTXBF); // wait until transmit buffer empty 
U2TXREG =C; // transmit character over serial port 
} 


void putstrserial(char *str) { 
int i=0; 


while (str[i] !=0) { // iterate over string 
putcharserial(str[it+]); // send each character 
} 


int main(void) { 
char str[80]; 


inituart(); 

while(1) { 
putstrserial("Please type something: ™); 
getstrserial(str); 
printf("\n\rYou typed: 4s\n\r", str); 

} 


a 
在 PC 上 用 < 程序 与 串口 进行 通信 有 点 儿 麻 烦 ， 因 为 串口 驱动 程序 库 没 有 路 操作 系统 的 规 
范 。 其 他 编程 环境 ， 如 Python, MATLAB 或 LabVIEW ， 可 顺利 地 进行 串 行 通信 。 


8.6.4 ”计时 器 


散人 入 式 系统 通常 需要 测量 时 间 。 例 如 ， 微 波 炉 需 要 一 个 计时 器 来 跟踪 日 期 时 间 ， 男 一 个 计 
时 融 测 量 亮 饪 时 间 。 它 还 可 能 使 用 另 一 个 计时 器 产生 脉冲 使 马达 旋转 食物 盘 ， 以 及 第 四 个 计时 
人 策 通 过 仅 在 每 秒 的 一 小 部 分 时 间 内 激活 微波 能 量 来 控制 功率 设置 。 

PIC32 在 主板 上 有 5 个 16 位 计时 器 。 计 时 器 1 称 为 A 型 计 表 8-8 A 类 计时 器 的 预 分 频 器 
时 器 ， 可 以 接受 异步 外 部 时 钟 源 ， 例 如 一 个 32kHz 钟表 晶体 。 计 | __TCKPS[1:0] 预 分 频 


时 器 2/3 和 4/5 是 B 型 计时 器 。 它 们 与 外 设 时 钟 同步 运行 并 且 可 = 
配对 (例如 ，2 与 3 配对 ) 构 成 32 位 计时 器 ， 用 于 测量 长 时 间 段 。 b wH 
每 个 计时 器 与 3 个 16 位 寄存 器 相关 联 : TxCON、TMRx 和 — 1) 256: 


PRx。 例 如 ，TICON 是 计时 器 1 的 控制 寄存 器 。CON 是 控制 寄存 
表 8-9 B 类 计时 器 的 预 分 频 器 
器 ，TMR 包含 当前 时 间 计数 ，PR 是 周期 寄存 器 。 当 计时 器 达到 ~— oo aoe 


指定 时 间 时 ， 它 回 到 0 并 设置 FSO 中 断 标志 寄存 器 的 TxIF 位 。 000 1:1 
程序 可 通过 查询 该 位 来 检测 溢出 。 或 者 ， 它 可 以 生成 一 个 中 断 。 = np 

默认 情况 下 ， 每 个 计时 器 相当 于 一 个 16 位 计数 器 ， 它 累 011 8:1 
加 内 部 外 设 时 钟 (在 这 个 例子 中 是 20MHz ) 的 节拍 。CON 寄存 100 16:1 
器 的 第 15 位 (ON 位 ) 启 动 计 时 器 计数 。CON 寄存 器 的 TCKPS Sn ak 


位 指定 预 分 频 器 (prescalar) ， 如 表 8-8 和 表 8-9 Pax. M k: 1 HE 111 set 
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行 预 分 频 使 计时 器 在 每 大 个 节拍 只 计数 一 次 。 这 可 用 于 产生 更 长 的 时 间 间 隔 ， 特 别 是 当 外 设 时 
钟 运行 得 很 快 时 。 其 他 CON 寄存 器 位 在 A 类 和 B 类 计时 器 中 稍 有 不 同 ， 详 见 数据 手册 。 
延迟 产生 
编写 2 个 函数 ， 它 们 使 用 计时 器 1 创建 指定 数量 的 微 秒 级 和 毫秒 级 延迟 。 假 设 外 设 时 钟 运 
行 在 20MHz。 
解 : 每 微 秒 为 20 个 外 设 时 钟 周期 。 根 据 示 波 器 观察 经 验 ，delaymicros 函数 有 大 约 6 微 
秒 的 时 间 开 销 用 于 函数 调用 和 计时 器 初始 化 。 所 以 , 设置 PR 为 20 x (micros -6) 。 因 此 ， 
该 函数 在 持续 时 间 小 于 6 微 秒 时 是 不 准确 的 。 在 开始 时 的 检查 可 以 防止 16 位 PR 的 溢出 。 
delaymillis 函数 重复 调用 delaymicros(1000) 来 创建 适当 数量 的 1 毫秒 延迟 。 


#include <P32xxxx.h> 





void delaymicros(int micros) { 
if (micros > 1000) { // avoid timer overflow 
delaymicros(1000); 
delaymicros(micros-1000); 
} 
else if (micros > 6) { 


TMR1 =0; // reset timer to 0 
TICONbits.ON=1; // turn timer on 
PR1 = (micros-6)*20; // 20 clocks per microsecond. 

// Function has overhead of ~6 us 
IFSObits.T1IF =0; // clear overflow flag 


while (!IFSObits.T1IF); // wait until overflow flag is set 
} . 
} 


void delaymillis(int millis) { 
while (millis--) delaymicros(1000); // repeatedly delay 1ms until done > 
} i 
另 一 个 方便 的 计时 器 功能 是 门 控 时 间 累 加 (gated time accumulation) ， 其 中 ， 只 有 当 外 部 引 
脚 为 高 电 平 计 时 器 才 计 数 。 这 人 允许 计时 器 测量 外 部 脉冲 的 持续 时 间 。 使 用 CON 寄存 器 使 能 它 。 


8.6.5 中 断 


定时 器 通常 与 中 断 结合 使 用 ， 这 样 程序 可 以 照常 运行 ， 并 周期 性 地 在 计时 器 产生 中 断 时 处 
理 相应 的 任务 。6. 7. 2 节 从 体系 结构 的 角度 描述 了 MIPS 中 断 。 本 节 将 探讨 如 何在 PIC32 中 使 用 
中 断 。 

当 硬 件 事 件 发 生 时 中 断 请 求 出 现 ， 例 如 计时 器 溢出 、 通 过 UART 接收 到 字符 ， 或 某 些 
GPIO 引 脚 切换 。 每 种 类 型 的 中 断 请 求 都 设置 中 断 标志 状态 (Interrupt Flag Status, IFS) AFAFA 
特定 位 。 然 后 处 理 器 检查 中 断 允 许 控 制 ( Interrupt Enable Control, IEC) 寄存 器 的 相应 位 。 如 果 
该 位 被 设置 ， 微 控制 器 应 通过 调用 中 断 服务 例 程 (Interrupt Service Routine, ISR) 响应 中 断 请 求 。 
ISR 是 带 有 void 参数 的 函数 ， 它 处 理 中 断 并 在 返回 前 清除 IFS 的 相应 位 。PIC32 中 断 系 统 支 持 
单 向 量 和 多 向 量 模式 。 在 单 向 量 模式 中 ， 所 有 中 断 调 用 相同 的 SR， 它 必须 检查 CAUSE( 原因 ) 
寄存 器 来 确定 中 断 的 原因 ( 如果 可 能 出 现 多 种 类 型 的 中 断 ) 并 相应 地 处 理 它 。 在 多 向 量 模式 中 ， 
每 种 类 型 的 中 断 调用 不 同 的 ISR。INTCON 寄存 器 中 的 MVEC 位 用 于 确定 模式 。 在 任何 情况 下 ， 
MIPS 中 断 系 统 必 须 在 它 接受 任何 中 断 前 使 用 ei 指令 局 用 。 

PIC32 还 允许 每 个 中 断 源 有 可 配置 的 优先 级 (priority) 和 子 优先 级 (subpriority) 。 优 先 级 范围 
是 0 ~7，7 为 最 高 级 。 较 高 优先 级 的 中 断 会 抢占 正在 处 理 的 中 断 。 例 如 ， 假 设 一 个 UART 中 断 


528 
? 


338 第 8 章 


优先 级 为 5， 而 一 个 计时 器 中 断 优先 级 为 7。 如 果 程 序 正常 执行 ， 在 UART 上 出 现 一 个 字符 ， 
那么 将 产生 一 个 中 断 使 微 控制 器 从 UART 读 取 数 据 并 处 理 它 。 如 果 在 UART ISR 有 效 时 计时 融 
溢出 ，ISR 自身 将 被 中 断 使 微 控 制 器 可 以 立即 处 理 计时 器 溢出 。 当 它 完成 后 ， 它 将 在 返回 到 主 
程序 之 前 完成 UART 中 断 。 另 一 方面 ， 如 果 计 时 器 中 断 优 先 级 为 2， 那 么 将 先 完 成 UART ISR, 
然后 调用 计时 器 ISR， 最 后 回 到 主 程序 。 

子 优先 级 的 范围 是 0 ~3。 如 果 两 个 具有 相同 优先 级 的 事件 同时 挂 起 ， 具 有 更 高 子 优先 级 
的 事件 将 被 优先 处 理 。 但 是 ， 子 优先 级 不 会 引起 一 个 新 的 中 断 抢占 当前 正 被 服务 的 相同 优先 级 
的 中 断 。 每 个 事件 的 优先 级 和 子 优先 级 用 IPC 寄存 器 配置 。 

每 个 中 断 源 有 一 个 0 ~63 范围 内 的 向 量 号 。 例 如 ， 计 时 器 1 溢出 中 断 为 回 量 4，UART2 RX 
中 断 为 向 量 32， 通 过 RDO 引 脚 变化 触发 的 INTO 外 部 中 断 为 向 量 3。IFS、IEC 和 IPC 寄存 器 的 
字段 对 应 的 向 量 号 在 PIC32 数据 手册 中 说 明 。 

ISR 函数 声明 由 两 个 特殊 ”attribute 指示 符 标 记 ， 说 明 优先 级 和 向 量 号 。 编 译 占 使 
用 这 些 属性 关联 ISR 与 相应 的 中 断 请 求 。《Microchip MPLAB®C Compiler For PIC32 MCUs User’ s 
Guide》 有 关于 编写 中 断 服务 程序 的 更 多 信息 。 

周期 性 中 断 

使 用 中 断 编 写 一 个 使 LED 以 1Hz 闪烁 的 程序 。 

解 : 我 们 设置 计时 器 1 BEB 0.5 秒 溢出 ， 并 在 中 断 处 理 程序 中 将 LED 在 ON 和 OFF 之 间 
切换 。 

下 面 的 代码 说 明了 多 向 量 模式 操作 ， 即 使 只 有 计时 器 1 中 断 是 实际 使 能 的 。blinkISR pf 
数 的 属性 表明 它 具 有 优先 级 7(IPL7) ， 为 向 量 4( 计 时 器 1 溢出 向 量 )。fISR 切换 LED 并 清除 
IFS0 的 计时 需 工 中 断 标 志 (T1 正 ) 位 ， 然 后 返回 。 

initTimerlInterrupt KOS Ei ITA ASA A 1/2 秒 ， 使 用 256: 1 预 分 频 器 和 39 063 
节拍 。 它 局 用 多 回 量 模式 。 优 先 级 和 子 优先 级 分 别 在 IPC] 寄存 器 的 4: 2 位 和 1: 0 位 指定 。 
计 定 时 器 1 中 断 标 志 (T1 下 ，IFS0 的 第 4 位 ) 被 清 零 ， 计 时 器 中 断 使 能 (TI1 正 ，IEC0 第 4 位 ) 被 
设置 为 从 计时 器 1 eS PT, Ba, asm 指示 符 用 于 生成 ei 指令 来 使 能 中 断 系统 。 

main 困 数 在 初始 化 计时 器 中 断后 ， 在 一 个 while 循环 中 等 待 。 但 是 ， 它 可 以 做 一 些 更 有 
趣 的 事情 ， 例 如 与 用 户 玩 游 戏 ， 而 中 断 程序 仍 确保 LED 以 正确 的 速率 闪烁 。 


#include <p32xxxx.h> 


// The Timer 1 interrupt is Vector 4, using enable bit IECO<4> 
// and flag bit IFSO<4>, priority IPC1<4:2>, subpriority IPC1<1:0> 


void _ _attribute_ _((interrupt(IPL7))) _ _attribute_ _((vector(4))) 


blinkISR(void) { 
PORTDbits.RDO = !PORTDbits.RDO; // toggle the LED 
IFSObits.T1IF=0; // clear the interrupt flag 
return; 


void initTimerlinterrupt(void) { 
TICONbits.ON=0O; // turn timer off 
TMR1 = 0; // reset timer to 0 


TICONbits.TCKPS=3; // 1:256 prescale: 20 MHz / 256=78.125 KHz 
PR1 = 39063; // toggle every half-second (one second period) 


INTCONbits .MVEC =1; // enable multi-vector mode - we’re using vector 4 
IPCI = 0x7 << 2 | 0x3; // priority 7, subpriority 3 

IFSObits.T1lIF = 0; // clear the Timer 1 interrupt flag 
IECObits.T1IE=1; // enable the Timer 1 interrupt 
asmvolatile("ei"); // enable interrupts on the micro-controller 
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TICONbits.ON=1; // turn timer on 
} 


int main(void) | 
TRISD = 0; // set up PORTD to drive LEDs 
PORTD=0; 


initTimerlInterrupt(); 


while(1); // just wait, or do something useful here 


8.6.6 模拟 IO 


真实 的 世界 是 模拟 信号 的 世界 。 许 多 艇 入 式 系 统 需要 模拟 输入 和 输出 与 外 界 交 互 。 它 们 使 
用 模拟 数字 转换 器 ( Analog-to-Digital-Converter，ADC ) 将 模拟 信和 号 clk Vop 
量化 成 数字 值 ， 使 用 数字 模拟 转换 器 (Digital-to-Analog-Converter， > N 
DAC) 做 相反 的 事情 。 图 8-45 展示 了 这 些 组 件 的 符号 。 转 换 器 的 O aia x 
特征 由 它们 的 分 辨 率 、 动 态 范围 、 采 样 频 率 和 准确 度 来 决定 。 例 


如 ， 一 个 ADC 可 能 有 N = 12 位 分 辩 率 ,范围 V ~ Ve 0 ~5V， fr 

采样 频率 为 人 = 44kHz， 准 确 度 为 上 3 最 低 有 效 位 (1sb) 。 采 样 频 x 

率 的 单位 也 可 写成 样本 / 秒 (samples per second, sps), HP 1sps = 

1Hz。 模 拟 输入 电压 Vi, (0) 与 数字 样本 X n | ZA ARE rot wa ret 

X[n] ol an Va (t) al 人 y 
We Fp Vet 
j (8-5) b) 
= ri 8-45 ADC Al DAC 符号 


例如 ，2. 5V( 全 部 量程 的 一 半 ) 输 入 电压 对 应 于 100000000000, = 800, 的 输出 ， 不 确定 性 高 
达 3 个 lsb, 

同样 ， 在 Va =2. 56V 的 全 量程 输出 电压 上 ，DAC 可 能 具有 N = 16 位 的 分 辩 率 。 它 产生 的 
输出 为 
V(t) = MP 

许多 微 控制 器 具有 内 置 的 中 等 性 能 的 ADC。 对 于 更 高 的 性 能 (例如 ，16 位 分 辩 率 或 超过 
1MHz 的 采样 频率 ) ， 通 常 需要 使 用 连接 到 微 控制 器 的 独立 ADC。 较 少 的 微 控制 器 具有 内 置 的 
DAC， 所 以 可 以 使 用 独立 芯片 。 然 而 ， 微 控制 器 经 常 使 用 一 种 称 为 脉冲 宽度 调制 (Pulse- Width 
Modulation, PWM) 技术 模拟 输出 。 本 节 在 PIC32 微 控制 器 背景 下 描述 模拟 O, 

1 模拟 /数字 转换 

PIC32 中 有 一 个 10 位 ADC， 它 的 最 高 速度 为 100 万 个 样本 / 秒 ( Msps)。ADC 可 以 通过 一 个 
模拟 复 用 器 连接 到 16 个 模拟 输入 引 脚 的 任何 一 个 。 模 拟 输入 称 为 ANO-15， 它 们 与 数字 VO 端 
O RB 共享 引 脚 。 默 认 情况 下 ，V,. 是 模拟 Von SUM, Vu 是 模拟 CND 引 脚 。 在 我 们 的 系统 中 ， 
它 就 是 3.3V 和 0V。 程 序 员 必 须 初始 化 ADC， 指 定 采样 的 引 脚 ， 等 待 足 够 长 的 时 间 进 行 电压 采 
样 ， 启 动 转换 ， 等 竺 直到 它 完成 ， 读 取 结 果 。 

ADC 是 高 度 可 配置 的 ， 可 以 在 可 编程 时 间 间 隔 里 自动 扫描 多 个 模拟 输入 并 在 完成 时 生成 中 
断 。 本 节 简单 描述 如 何 读 取 一 个 单独 的 模拟 输入 引 脚 。 其 他 特性 详 见 《PIC32 系列 参考 手册 》。 

ADC 由 许多 寄存 器 控制 : ADICONI- 3, ADICHS, ADIPCFG, ADICSSL 和 ADCIBUFO- F, 
ADICONI 是 主 控制 寄存 器 。 它 有 一 个 ON 位 用 于 启用 ADC， 一 个 SAMP 位 用 于 控制 何 时 进行 采样 和 
转换 ， 以 及 一 个 DONE 位 指示 转换 完成 。ADICON3 具有 ADCS[7:0] 位 用 于 控制 模拟 /数字 (A/D) 转 





Va (8-6) 
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换 的 速度 。AD1CHS 是 通道 选择 寄存 器 用 于 指定 要 采样 的 模拟 输入 。AD1PCFG 是 引 脚 配置 寄 
存 器 。 当 一 位 为 0 时 ， 相 应 的 引 脚 作为 模拟 输入 。 当 这 位 为 1 时 ,该 引 脚 用 作 数 字 输 入 。 
ADCI BUFO 用 于 存储 10 位 转换 结果 。 其 他 寄存 器 在 我 们 的 简单 例子 中 不 需要 。 

ADC 使 用 逐次 副 近 寄存 器 在 每 个 ADC 时 钟 周期 生成 1 位 的 结果 。 对 于 总 共 12 个 ADC 时 
钟 /转换 ， 需 要 两 个 额外 的 周期 。 为 保证 正确 操作 ，ADC 时 钟 周期 Tue 必须 至 少 为 65ns。 根 据 
FREH ADCS 位 ， 它 被 设置 为 外 设 时 钟 周期 Tbs 的 倍数 。 

SS (8-7) 

因此 ， 对 于 高 达 30MHz 的 外 设 时 钟 ，ADCS 位 可 保留 为 默认 值 0。 

采样 时 间 是 新 输入 转换 开始 前 必需 的 稳定 时 间 。 只 要 所 要 采样 的 源 电 阻 小 于 5KQ ,采样 时 
间 就 可 以 小 到 132ns， 这 只 是 很 小 的 时 钟 周 期 。 

模拟 输入 

编写 程序 来 读 取 AN11 引 脚 的 模拟 值 。 

解 : initadc Kaine ADC 并 选择 指定 的 通道 。 它 让 ADC 采用 采样 模式 。readadc 
函数 结束 采样 并 启动 转换 。 它 等 待 直到 转换 完成 ， 然 后 重新 开始 采样 并 返回 转换 结果 。 

#include <P32xxxx.h> 


void initadc(int channel) { 
ADICHSbits.CHOSA=channel; // select which channel to sample 


AD1PCFGCLR = 1 << channel; // configure pin for this channel to 
// analog input 
ADICON1bits.ON=1; // turn ADC on 
ADICON1bits.SAMP =1; // begin sampling 
ADICONIbits.DONE = 0; // clear DONE flag 
} 
int readadc(void) { 
ADICON1bits.SAMP = 0; // end sampling, start conversion 
while (!ADICON1bits.DONE); // wait until done converting 
ADICON1bits.SAMP = 1; // resume sampling to prepare for next 
// conversion 
ADICON1bits.DONE =0; // clear DONE flag 
return ADCIBUFO; // return conversion result 


int main(void) { 
int sample; 


initadc(11); 
sample = readadc(); 
<4 


2. 数字 /模拟 转换 

PIC32 没有 内 置 DAC， 所 以 本 节 介 绍 使 用 外 部 DAC 进行 数字 /模拟 (D/A) 转换 。 本 节 还 阅 
述 PIC32 通过 并 行 端口 和 串 行 端口 与 其 他 芯片 进行 交互 的 过 程 。 相 同 的 方法 可 以 用 于 PIC32 与 
更 高 分 辨 率 或 更 快 外 部 ADC 之 间 的 交互 。 

A DAC 通过 具有 条 连 线 的 并 行 接口 接收 W 位 数字 输入 ， 而 另 一 些 则 通过 串 行 接口 (如 
SPI) 接收 数据 。 有 些 DAC 要 求 正 /负电 源 电压 ， 而 其 他 的 则 使 用 单 电源 供电 操作 。 有 些 DAC 支 
持 弹 性 的 电源 电压 范围 ， 而 另 一 些 则 需要 特定 的 电压 。 输 入 逻辑 电 平 应 当 与 数字 源 兼容 。 有 些 
DAC 生成 与 数字 输入 成 正比 的 电压 输出 ， 而 另 一 些 则 产生 电流 输出 。 可 能 需要 一 个 运算 放大 
铝 来 将 此 电流 转换 为 所 需 范围 内 的 电压 。 

TEA TP, 我们 使 用 Analog Devices AD558 8 位 并 行 DAC 和 Linear Technology LTC1257 12 
位 串 行 DAC。 这 两 种 DAC 产生 电压 输出 ， 都 使 用 一 个 5 ~15V 电源 ， 使 用 Vin =2.4V, XESS 
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PIC32 的 3.3V 的 输出 兼容 ， 采 用 DIP 封装 使 它们 易于 安装 在 试验 电路 板 上 且 易 于 使 用 。AD558 
产生 范围 在 0 ~2. 56V 的 输出 ， 功 耗 为 75mW， 采 用 16 引 脚 封装 ， 并 有 1ps 稳定 时 间 (settling 
time) 从 而 允许 1M 样本 / 秒 的 输出 速率 。 数 据 手册 可 从 analog. com 获得 。LTC1257 产生 范围 
在 0 ~2. 048V 的 输出 ， 功 耗 低 于 2mW， 采用 8 引 脚 封装 ， 并 有 6ps 稳定 时 间 。 它 的 SPI 的 最 高 
频率 为 1.4MHz。 数 据 手册 可 从 linear. com 获得 。Texas Instruments 是 男 一 家 领先 的 ADC 和 
DAC 制造 商 。 

使 用 外 部 DAC 的 模拟 输出 

画 出 电路 图 并 编写 利用 PIC32、AD558 
和 LTC1257 生成 正弦 波 和 三 角 波 的 简单 信号 
BOE tit RE o 

ft: 图 8-46 显示 了 电路 。AD558 通过 
RD 8 位 并 行 端口 连 接 到 PIC32。 它 将 Vout 
Sense All Vout Select 连接 在 到 Vout 以 便 设置 
2. 56V 满 量程 输出 范围 。LTC1257 通过 SPR 
连接 到 PIC32。 两 个 ADC 都 采用 5V 电源 ， 
并 有 一 个 0.1pF 的 去 耦 电容 来 降低 电源 噪 
A, DAC 上 的 有 效 低 电 平 芯 片 使 能 和 负载 信 
号 指示 何 时 转换 为 下 一 个 数字 输入 。 当 加 载 
新 的 输入 时 ， 它 们 应 该 保持 高 电 平 。 

该 程序 如 下 所 示 。initio 初始 化 串口 
和 并 口 ， 并 用 周期 设置 计时 器 来 产生 所 需要 
的 输出 频率 。SPI 设置 为 16 位 模式 ， 运 行 在 图 8-46 到 PIC32 的 DAC 并 行 和 串 行 接口 
1MHz, 但 LTC1257 只 关心 最 后 12 位 发 送 数 
据 。initwavetables 预计 算 正 弦 波 和 三 角 波 的 样本 值 数 组 。 正 弦 波 的 量程 设置 为 12 位 ， 而 
三 角 波 设置 为 8 位 。 每 个 波 的 一 个 周期 有 64 个 采样 点 ， 改 变 这 个 值 是 交换 频率 的 精度 。gen- 
waves 通过 采样 循环 。 对 于 每 个 样本 ， 它 禁止 到 DAC 的 CE Al LOAD 信号 ,通过 并 行 和 串 行 端 
口 发 送 新 的 样本 ， 重 新 局 用 DAC， 然 后 等 待 直到 计时 器 指示 下 一 个 样本 的 时 间 到 。 正 弦 波 和 三 
角 波 的 最 小 频率 是 5Hz, 它 由 16 位 计时 器 1 周期 寄存 器 设置 最 大 频率 为 605Hz 
(38. 7Ksamples/s) 是 由 genwaves 肾 数 中 发 送 给 每 个 采样 点 的 时 间 设 置 ， 其 中 SPI 传送 占 了 主 
要 部 分 。 


#include <P32xxxx.h> 
#include <math.h> // required to use the sine function 


#define NUMPTS 64 
int sineLNUMPTS], triangle[NUMPTS]; 


~ 
uN 
N 
OO 
fm 
中 





void initio(int freq) { // freq can be 5-605 Hz 
TRISD = OxFFOO; // make the bottom 8 bits of PORT D outputs 
SPI2CONbits.ON = 0; // disable SPI to reset any previous state 
SPI2BRG = 9; // 1 MHz SPI clock 
SPIZ2CONDits.MSTEN = 1; // enable master mode 
SPIZ2CONbits.CKE = 1; // set clock-to-data timing 
SPI2CONbits .MODE16 = 1; // activate 16-bit mode 
SPIZCONbits.ON=1; // turn SPI on 
TRISF = OxFFFE; // make RFO an output to control load and ce 


PORTFbits.RFO=1; // set RFO=1 
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PR1 = (20e6/NUMPTS)/freq-1; // set period register for desired wave 
// frequency 
TICONbits.ON=1; // turn Timerl on 
} 


void initwavetables(void) { 
Int 
for (i=0; 1<NUMPTS; i++) { 
sine[i] = 2047*(sin(2*3.14159*i/NUMPTS) + 1); // 12-bit scale 
if (i<NUMPTS/2) triangleLi] =71*511/NUMPTS; // 8-bit scale 
else triangle[i] =510-i1*511/NUMPTS; 
} 
} 


void genwaves(void) | 


je 44 
while (1) { 
for (i=0; i<NUMPTS; i++) { 
IFSObits.T1LIF =0; // clear timer overflow flag 
PORTFbits.RFO=1; // disable loadwhile inputs are changing 
SPI2BUF = sine[i]; // send current points to the DACs 


PORTD=trianglelil; 
while (SPI2STATbits.SPIBUSY); // wait until transfer completes 
PORTFbits.RFO =0; // load new points into DACs 
while (!IFSObits.T1IF); // wait until time to send next point 
} 
} 


int main(void) { 
initio(500); 
initwavetables(); 
genwaves(); 
} «4 


3. 脉冲 宽度 调制 

男 一 种 产生 模拟 输出 的 方式 是 脉冲 宽度 调制 (Pulse-Width Modulation，PWM)， 它 产生 一 个 
周期 性 脉冲 输出 ， 输 出 的 一 部 分 为 高 电 平 ， 其 余部 分 为 低 电 平 。 占 空 比 是 脉冲 为 高 电 平 部 分 在 
一 个 周期 中 所 占 的 比例 ， 如 图 8-47 所 示 。 输 出 的 平均 值 正比 于 占 空 比 。 例 如 ， 如 果 输 出 在 0 ~ 
3.3V 之 间 摆动 ， 并 具有 25% 的 占 空 比 ， 则 电压 平均 值 为 0. 25 x3.3 =0. 825V。 对 PWM 信号 进 
行 低 通 滤 波 可 以 消除 振荡 并 使 信号 得 到 所 需 的 平均 值 。 


脉冲 宽度 占 空 比 = -脉冲 宽度 
周期 





图 8-47 脉冲 宽度 调制 信号 


PIC32 包含 5 个 输出 比较 (output compare ) 模 块 OC1 ~ 0C5 ， 每 个 模块 与 计时 器 2 或 3 BA, 
可 以 生成 PWM 输出 2?。 每 个 输出 比较 模块 与 3 个 32 位 寄存 器 相关 联 : OCxCON 、OCxR 和 
OCxRS。CON 是 控制 寄存 器 。CON 寄存 器 的 OCM 位 应 设置 为 110, 以 便 激活 PWM 模式 ，ON 位 
也 应 启用 。 默 认 情 况 下 ， 输 出 比较 模块 使 用 计时 需 2 运行 在 16 位 模式 ， 但 OCTSEL 和 0C32 位 
可 以 用 来 选择 计时 器 3 和 32 位 模式 。 在 PWM 模式 ，RS 设置 占 空 比 ， 计 时 器 的 周期 寄存 器 PR 


O 输出 比较 模块 还 可 以 配置 为 基于 计时 器 生成 单一 脉冲 。 


设置 周期 ，OCxR 可 以 忽略 。 

使 用 PWM 的 模拟 输出 

写 一 个 函数 ， 它 使 用 PWM 和 外 部 RC 滤波 器 生成 模拟 输出 电压 。 该 函数 应 接受 0(0V 输 
H) ~256( 全 量程 3.3V 输出 ) 之 间 的 输入 。 


fe: 使 用 OCI 模块 在 0C1 引 脚 上 产生 78. 125kHz 信号 。 图 8-48 PIC 
中 的 低 通 滤波 器 具有 如 下 转角 频率 以 便 消 除 高 速 振荡 并 传递 平均 值 。 
l 1kQ 
f. = ere 1. 6kHz OCI/RD0 46 Ka 
计时 天 应 在 20MHz 工作 ， 每 周期 有 256 节拍 ， 因 为 20MHz/256 OF 


得 到 所 需要 的 78. 125kHz PWM 频率 。 占 空 比 输入 是 输出 为 高 电 平 的 
节拍 数 。 如 果 占 空 比 为 0， 输 出 将 保持 在 低 电 平 。 如 果 是 256 或 更 SENS RR 中 
高 ， 输 出 将 保持 为 高 电 平 。 i 
PWM 代码 使 用 OCI 和 计时 器 2。 周 期 寄存 器 被 设置 为 255， 每 周期 有 256 节拍 。OC1RS 设置 
为 所 需 的 占 空 比 。0C1 配置 为 PWM 模式 ， 计 时 器 和 输出 比较 模块 接 通 。 该 程序 可 能 会 转移 到 其 
他 任务 ， 当 输出 比较 模块 继续 运行 时 。0C1 引 脚 将 持续 产生 PWM 信号 ， 直 到 它 被 明确 关闭 ; 
#include <P32xxxx.h> 


void genpwm(int dutycycle) 1 


PR2 = 255; // set period to 255+1 ticks = 78.125 KHz 

OC1RS = dutycycle; // set duty cycle 

OC1ICONbits .OCM = 0b110; // set output compare 1 module to PWM mode 

T2CONbits.ON=1; // turn on timer 2 in default mode (20 MHz, 
// 16-bit) 

OCICONits.ON=1; // turn on output compare 1 module 


| 4 
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Fe tll AAS HS Sj Ab BI CH, ASTI BL BI, FR SFP SK i Sid AN Ar 
(Liquid Crystal Display, LCD), VGA 显示 器 、 蓝 牙 无 线 链 路 和 电动 机 控制 。 标 准 通信 接口 ， 包 
括 USB 和 以 太 网 ， 它 们 将 在 8.7.1 0 #8. 7. 4 PIR. 

1. 字符 LCD 

字符 LCD 是 一 个 小 的 液晶 显示 器 ， 它 能 够 显示 一 行 或 多 行文 本 。 它 们 通常 用 在 设备 的 面 
板 ， 例 如 收银 机 、 激 光 打 印 机 和 传真 机 ， 这 些 设备 需要 显示 有 限 的 信息 量 。 它 们 很 容易 通过 并 
口 、RS-232 或 SPI 接口 与 微 控制 器 通信 。Crystalfontz America 销售 各 种 字符 LCD， 从 8 列 xl 
行 ~40 列 x4 行 ， 可 选择 颜色 、 背 光源 、3. 3/5V 操作 和 日 光 能 见 度 。 在 小 批量 时 ， 它 们 的 液 
晶 显示 器 需 花 费 20 美元 或 更 多 ,但 大 批量 时 价格 回落 到 低 于 5 美元 。 

本 节 给 出 了 一 个 通过 8 位 并 行 接口 连接 PIC32 单片机 和 字符 LCD 的 例子 。 该 接口 兼容 于 行 
业 标 准 HD44780 LCD 控制 器 (最 初 由 Hitachi 开发 ) 。 图 8-49 显示 了 Crystalfontz CFAH2002ATMI- 
JT 20 x2 并 行 液 晶 显 示 器 。 





8-49  Crystalfontz CFAH2002A-TMI 20 x2 字符 LCD 
(©2012 Crystalfontz America, AI HR) 
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8-50 展示 了 LCD 通过 8 位 并 行 接口 连接 到 PIC32。 逻 辑 可 工作 在 5SV， 但 与 PIC32 的 
3. 3V 输入 兼容 。LCD 的 对 比 度 是 由 另 一 个 用 电位 计 产 生 的 电压 来 设 定 ， 它 通常 可 读 性 最 强 的 
是 设置 为 4.2 ~4.8V。LCD 接收 3 个 控制 信号 : RS(1 代表 字符 , 0 代表 指令 ) 、R/W(1 表示 从 
显示 屏 读 取 ，0 表示 写 和 人 显示 屏 ) 和 EE( 高 电 平 表 示 在 下 一 个 字 节 准备 好 之 前 需要 至 少 250ns 时 
间 来 使 能 液晶 显示 器 )。 当 指令 被 读 出 时 ,第 7 位 返回 忙 标志 ， 忙 时 标记 为 1， 当 LCD 已 准备 
好 接受 男 一 条 指令 时 标记 为 0。 然 而 ， 某 些 初 始 化 步骤 和 清除 指令 需要 指定 的 延迟 ， 而 不 是 检 
查 忙 标志 。 

为 了 初始 化 LCD, PIC32 必须 写 一 系列 指令 
到 LCD 中 ， 如 下 所 示 。 


加载 后 ， 等 待 > 15 000 微 秒 。 

写 人 0x30 来 设置 8 位 模式 。 

等 待 >4100 微 秒 。 

写 人 0x30 再 次 设置 8 位 模式 。 

等 待 > 100 微 秒 。 

写 人 0x30 再 次 设置 8 位 模式 。 

等 待 直到 忙 标志 清除 。 

写 人 0x3C 设置 2 条 线 和 5 x8 点 阵 字体 。 
等 待 直到 忙 标 志清 除 。 

写 人 0x08 以 关闭 显示 屏 。 

等 待 直 到 忙 标志 清除 。 

写 人 0x01 清除 显示 屏 。 

等 待 > 1530 微 秒 。 

写 人 0x06 设置 输入 模式 以 便 在 每 个 字 
符 后 增加 光标 。 

等 待 直 到 忙 标 志清 除 。 

写 人 0x0C 以 打开 没有 光标 的 显示 屏 。 


然后 ， 为 了 将 文本 写 人 LCD, ， 微 控制 器 可 
以 发 送 ASCH 字符 序列 。 它 也 可 以 发 送 指令 为 
0x01 来 清除 显示 器 或 0x02 返回 到 左上 方 的 起 始 


位 置 。 


LCD 控制 
写 一 个 程序 把 “I love LCDs” 写 人 字符 显示 器 。 

解 : 以 下 程序 把 “I love LCDs” 写 入 显示 器 。 它 需要 使 用 例 8.21 中 的 delaymicros Mi, 
#include <P32xxxx.h> 

typedef enum {INSTR, DATA} mode; 


char ]cdread(mode md) { 
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char C; 

TRISE = OxFFFF; // make PORTEL7:0] input 
PORTCbits.RC14 = (md == DATA); // set instruction or data mode 
PORTCbits.RC13=1; // read mode 
PORTCbits.RC15=1; | // pulse enable 
delaymicros(10); // wait for LCD to respond 

c = PORTE & OxOOFF; // read a byte from port E 


PORTCbits.RC15 = 0; // turn off enable 
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delaymicros(10); // wait for LCD to respond 
} 


void lcdbusywait(void) 
{ 
char state; 


do { 
state = |lcdread( INSTR); // read instruction 
} while (state & 0x80); // repeat until busy flag is clear 


} 


char lcdwrite(char val, mode md) { 


TRISE = OxFFOO; // make PORTEL7:0] output 
PORTCbits.RC14 = (md == DATA); // set instruction or data mode 
PORTCbits.RC13 = 0; // write mode 

PORTE = val; // value to write 
PORTCbits.RC15 =1; // pulse enable 
delaymicros(10); // wait for LCD to respond 
PORTCbits.RC15=0; // turn off enable 
delaymicros(10); // wait for LCD to respond 


} 
char Icdprintstring(char *str) 
{ 
while(*str !=0) { // loop until null terminator 
Icdwrite(*str, DATA); // print this character 
Icdbusywait(); 
str+; // advance pointer to next character in string 
} 
} 


void lcdclear(void) 
{ 
ledwrite(0x01, INSTR); // clear display 
delaymicros(1530); // wait for execution 
} 


void initlcd(void) { 
// set LCD control pins 


TRISC = Ox1FFF; // PORTCL15:13] are outputs, others are inputs 
PORTC = 0x0000; // turn off all controls 

// send instructions to initialize the display 

delaymicros(15000); 


Icdwrite(0x30, INSTR); // 8-bit mode 
delaymicros(4100); 
lcdwrite(0x30, INSTR); // 8-bit mode 
delaymicros(100); 
ledwrite(0x30, INSTR); // 8-bit mode yet again! 
lcdbusywait(); 
lcdwrite(0x3C, INSTR); // set 2 lines, 5x8 font 
|cdbusywait(); 
lcdwrite(0x08, INSTR); // turn display off 
lcdbusywait(); 
ledclear(); 
lcdwrite(0x06, INSTR); // set entry mode to increment cursor 
lcdbusywait(); 
ledwrite(0x0C, INSTR); // turn display on with no cursor 
lcedbusywait(); 

} 


int main(void) { 

initlcd(); 

lcdprintstring("“I love LCDs"); 
} 
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2. VGA 显示 器 

更 灵活 的 显示 选项 是 驱动 计算 机 显示 器 。 视 频 图 形 阵 列 (Video Graphics Array, VGA) 显示 
器 标准 于 1987 年 提出 ， 最 先 用 于 IBM PS/2 计算 机 ， 在 阴极 射线 管 (Cathode Ray Tube, CRT) 上 
具有 640 x480 像素 分 辨 率 ， 使 用 一 个 15 针 连 接 器 通过 模拟 电压 传输 彩色 信息 。 现 代 液 晶 显 示 
器 具有 更 高 的 分 辨 率 ， 但 保持 与 VGA 标准 的 向 后 兼容 。 

在 阴极 射线 管 中 ， 电 子 枪 从 左 到 右 扫描 屏幕 发 射出 效 光 材料 来 显示 图 像 。 彩 色 阴 极 射 线 管 
使 用 3 种 不 同 的 荧光 体 ( 红 、 绿 、 蓝 ) 和 3 个 电子 波束 。 每 个 波束 的 强度 决定 像素 中 每 种 颜色 的 
强度 。 在 每 条 扫描 线 的 末端 ， 电 子 枪 必须 关闭 一 段 时 间 ， 称 为 水 平 消 隐 间隔 (orizontal blanking 
interval) ， 以 便 返 回 到 下 一 条 扫描 线 的 开头 。 所 有 扫描 线 完成 后 ， 电 子 枪 必须 再 次 关闭 一 段 时 
间 ， 称 为 垂直 消 隐 间隔 (vertical blanking interval) 以 便 返 回 到 左上 角 。 该 过 程 每 秒 重复 大 约 60 ~ 
75 次 ， 以 便 得 到 一 个 稳定 的 视觉 图 像 。 

640 x480 像素 的 VGA 显示 器 的 刷新 频率 为 59.94Hz， 像素 时 钟 为 25.175MHz， 因 此 每 个 
像素 宽度 为 39. 72ns。 全 屏幕 可 以 看 作 525 条 水 平 扫 描 线 ， 每 条 扫描 线 800 像素 ,但 只 有 480 条 
扫描 线 和 每 条 扫描 线 中 的 640 像素 实际 用 于 传送 图 像 ， 而 其 余 的 都 是 黑色 。 扫 摘 线 始 于 后 洛 
(back porch) ， 屏 幕 左 边缘 的 空白 区 域 。 它 包含 640 MRA, AMES A Bf % (front porch), € 
在 屏幕 的 右边 缘 ， 然 后 是 一 个 水 平 同 步 (hsync ) 脉冲 将 电子 枪 快速 移动 回 左边 缘 。 图 8-51a 显示 
了 上 述 每 个 扫描 线 部 分 的 时 序 ， 从 有 效 像素 开始 。 整 个 扫描 线 是 31.778 微 秒 长 。 在 垂直 方向 
上 ,屏幕 始 于 在 顶部 的 后 沿 ， 后 面 是 480 条 有 效 扫描 线 ， 随 后 是 底部 的 前 沿 和 一 个 垂直 同步 
(vsync ) 脉冲 以 便 返 回 到 顶部 开始 的 下 一 帧 。 新 帧 绘制 频率 为 每 秒 60 次 。 图 8-51b 展示 了 垂直 
时 序 。 注 意 ， 时 间 单 位 是 扫描 线 ， 而 不 是 像素 时 钟 。 更 高 的 分 辨 率 使 用 更 快 的 像素 时 钟 ，388 
x1536 @ 85Hz 时 高 达 2048MHz。 例 如 ，1024 x768 @ 60Hz 可 以 使 用 65MHz 像素 时 钟 来 实现 。 
水 平时 序 包 括 16 个 时 钟 的 前 沿 ，96 个 时 钟 的 同步 脉冲 ， 以 及 48 个 时 钟 的 后 沿 。 垂 直 时 序 包 括 
11 条 扫描 线 的 前 沿 ，2 条 扫描 线 的 垂直 同步 脉 溃 和 32 条 扫描 线 的 后 沿 。 


Hsyne | i | | | i 
1 i 1 
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i 
i b) EH iti I 
图 8-51 VGA 时 序 


图 8-52 显示 了 来 自视 频 源 的 母 连 接 器 的 引 脚 图 。 像 素 信息 使 用 3 个 模拟 电压 传送 ， 分 别 
代表 红色 、 绿 色 和 蓝 色 。 每 个 电压 范围 是 0 ~0.7V， 电 压 越 大 表示 亮度 越 大 。 该 电压 在 前 沿 和 
后 沿 时 应 为 0。 该 电缆 还 提供 TC 串 行 链 路 来 配置 显示 器 。 
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必须 实时 高 速生 成 视频 信号 ， 这 在 微 控制 器 上 实现 有 些 困难 ， 但 在 FPGA 上 却 容易 实现 。 


简单 的 黑白 显示 可 以 通过 使 用 0 或 0.7V 驱动 所 有 的 三 色 引 脚 来 
产生 ， 它 采用 连接 到 数字 输出 引 脚 的 分 压 器 。 另 一 方面 ， 彩 色 
显示 器 使 用 具有 3 个 独立 D/A 转换 器 的 视频 DAC( video DAC) 
以 便 独 立地 驱动 三 色 引 脚 。 图 8-53 显示 了 一 个 通过 ADV7125 
三 重 8 位 视频 DAC 来 驱动 VGA 显示 器 的 FPGA。DAC 接收 来 自 
FPGA 的 8 位 R、G 和 B 信号 。 它 还 接收 SYNC bb 信号 ， 当 
HSYNC 或 VSYNC 有 效 时 该 信号 被 驱动 为 低 电 平 有 效 。 视 频 
DAC 产生 3 个 输出 电流 来 驱动 红 、 绿 、 蓝 模拟 线路 ， 这 通常 是 
平行 直 连 视频 DAC 和 显示 器 的 750 HHA. Roer BAIR SH E 
电流 的 量程 ， 以 便 实 现 彩 色 的 满 量程 。 时 钟 速率 取决 于 分 辩 率 
和 刷新 率 ， 使 用 快速 等 级 的 ADV7125JSTZ330 模型 DAC 可 能 高 
ik 330MHz。 


Cyclone JI FPGA 
EP3CE144C8 ADV7125# HDAC 


RO 143 IOR 34 
RI 142 
R2 141 IOG 32 
R3 138 
R4 137 IOB 28 
R5 136 aA: 
R6 135 TOR 33 
R7 133 


GO 132 
G1 129 
G2 128 
G3 127 
G4 126 
G5 125 
G6 124 
G7 121 


IOG 31 
IOB 27 
COMP 35 


VAA 13, 29, 30 


GND 12 14 15 
BO 120 25 26 39 40 
B1 119 
B2 115 Reas? 
B3 114 


B4 111 
B5 110 
B6 106 
B7 105 PSAVE 38 
SYNC b 144 


BLANK b 104 
VGACLK 113 


HSYNC 112 
VSYNC 103 








1: 红色 9: 5V ( 可 选 的 ) 


2: 绿色 10: GND 

3: 蓝 色 11: 预 留 的 
4: 预 留 的 12: FC 数据 
5: GND 13: HSyne 


6: GND 14: Vsyne 
7: GND 15: PC 时 钟 


8-52 VGA 连接 器 引 脚 图 


VGA 连 接 器 


11 预 留 的 
12 I2C 数 据 
13 Hsyne 
14 Vsyne 
15 IC 时 钟 


图 8-53 ”通过 视频 DAC 驱动 VGA 使 能 的 FPGA 


VGA 显示 器 显示 


使 用 图 8-53 中 的 电路 编写 HDL 代码 以 便 在 VGA 显示 器 上 显示 文本 和 一 个 绿色 的 框 。 

解 : 该 代码 假定 40MHz 的 系统 时 钟 频率 ， 并 在 FPGA 上 使 用 一 个 锁 相 环 ( Phase Locked 
Loop ，PLL) 来 生成 25. 175MHz 的 VGA 时 钟 。PLL 中 的 配置 不 同 于 FFGA。 对 于 Cyclone I, Ji 
率 通 过 Altera 的 宏 功 能 向 导 指定 。 或 者 ，VCA 时 钟 可 以 直接 由 信和 号 发 生 器 提供 。 < 

VGA 控制 器 通过 屏幕 上 的 列 和 行进 行 计数 ， 在 适当 的 时 候 生 成 hsyne 和 vsyne 信号 。 此 外 ， 
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它 还 生成 blank_b 信号 ， 当 坐标 在 640 x 480 有 效 区 域外 时 ， 此 信和 号 被 设置 为 低 电 平 以 便 绘 制 


黑色 。 


视频 发 生 器 基于 当前 (x，y) 像 素 位 置 产生 红 、 绿 、 蓝 颜色 值 。(0,，0) 表 示 左 上 角 。 视 频 
发 生 器 在 屏幕 上 绘制 一 组 字符 ， 以 及 一 个 绿色 和 矩形。 字符 生成 器 绘制 一 个 8 x8 像素 字符 ， 给 
定 的 屏幕 尺寸 为 80 x60 字符 。 它 从 ROM 上 查找 字符 ， 它 在 ROM 中 采用 二 进 制 编码 为 8 行 6 
列 字符 。 另 外 两 列 都 是 空白 。SystemVerilog 代码 中 的 位 顺序 是 反 转 的 ， 因 为 ROM 文件 中 的 最 


左 列 是 最 高 有 效 位 ， 而 它 应 绘制 在 最 低 有 效 x 位 置 。 


8-54 显示 了 正在 运行 此 程序 的 VGA 显示 器 的 照片 。 字 母 行 交 蔡 为 红色 和 蓝 色 ， 绿 色 框 


覆盖 了 一 部 分 图 片 。 





Vga.sy 


module vga(input logic 
output logic 
output logic 
output logic 


图 8-54 VGA 输出 


clk, 

vgaclk, // 25.175 MHz VGA clock 
hsync, vsync, 

sync_b, blank_b, // to monitor & DAC 


output logic [7:0] r,g, DJ; // to video DAC 


logic L930) «%, Ni 


// Use a PLL to create the 25.175 MHz VGA pixel clock 

// 25.175 MHz clk period = 39.772 ns 

// Screen is 800 clocks wide by 525 tall, but only 640 x 480 used for display 
// HSync = 1/(39.772 ns * 800) = 31.470 KHz 

// Vsync = 31.474 KHz / 525 = 59.94 Hz (~60 Hz refresh rate) 

pll vgapll(.inclkO(clk), .cO(vgaclk)); 


// generate monitor timing signals 
vgaController vgaCont(vgaclk, hsync, vsync, sync_b, blank_b, x,y); 


// user-defined module to determine pixel color 
videoGen videoGen(x, yY, r, g, D); 


endmodule 


module vgaController #(parameter HACTIVE = 10'd640, 


HFP = 10'416, 
HSYN = T0 'd96, 
HBP = 10'd48, 
HMAX = HACTIVE + HFP + HSYN + HBP, 


VBP = 10°d32, 
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VACTIVE = 10'd480, 


VFP = 10'd11, 

VSYN =10'd2, 

VMAX = VACTIVE + VFP + VSYN + VBP) 
(input logic vgaclk, 
output logic hsync, vsync, sync_b, blank_b, 


output logic [9:0] x, y); 


// counters for horizontal and vertical positions 
always @(posedge vgaclk) begin 


Xt++; 
if (x == HMAX) begin 
x=0; 
y+; 
if (y == VMAX) y= 0; 
end 
end 3 


// compute sync signals (active low) 

assign hsync =~(hcnt >= HACTIVE + HFP & hcnt < HACTIVE + HFP + HSYN); 
assign vsync =~(vcnt >= VACTIVE + VFP & vent < VACTIVE + VFP + VSYN); 
assign sync_b =hsync & vsync; 


// force outputs to black when outside the legal display area 
assign blank_b = (hcnt < HACTIVE) & (vcnt < VACTIVE); 
endmodule 


module videoGen(input logic [9:0] x, y, output logic [7:0] r, g, b); 
logic pixel, inrect; 


// given y position, choose a character to display 
// then look up the pixel value from the character ROM 
// and display it in red or blue. Also draw a green rectangle. 
chargenrom chargenromb(y[8:3]+8'd65, x[2:0], y[2:0], pixel); 
rectgen rectgen(x, y, 10’d120, 10’d150, 10’d200, 10’d230, inrect); 
assign {r, b} = (y[3]==0) ? {{8{pixel}},8’h00} : (8°h00,{8{pixel}}); 
assigng= inrect ? 8’hFF : 8’h00; 

endmodule 


module chargenrom(input logic [7:0] ch, 
input logic [2:0] xoff, yoff, 
output logic pixel); 


logic [5:0] charrom[l2047:0]; // character generator ROM 
logic [7:0] line; | // a line read from the ROM 


// initialize ROM with characters from text file 
initial 

$readmemb("charrom.txt", charrom); 
// index into ROM to find line of character 


assign line = charromLyoff+{ch-65, 3’b000}J; // subtract 65 because A 
// is entry 0 


// reverse order of bits 
assign pixel = line[3'd/7-xoff]; 
endmodule 


module rectgen(input logic [9:0] x, y, left, top, right, bot, 
output logic inrect); 


assign inrect = (x >= left & x < right &y >= top & y < bot); 
endmodule 
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charrom.txt 


// A ASCII 65 
011100 
100010 
100010 
111110 
100010 
100010 
100010 
000000 

//B ASCII 66 
111100 
100010 
100010 
111100 
100010 
100010 
111100 
000000 

//C ASCII 67 
011100 
100010 
100000 
100000 
100000 
100010 
011100 
000000 


3. 蓝牙 无 线 通 信 

现在 可 用 于 无 线 通信 的 标准 有 许多 ， 包 括 Wi-Fi, ZigBee 和 蓝牙 。 这 些 标 准 是 复杂 的 ， 并 
需要 复杂 的 集成 电路 ， 但 是 不 断 增加 的 模块 种 类 使 复杂 性 被 抽象 掉 ， 为 用 户 提 供 无 线 通 信 的 简 
单 界面 。BlueSMiRF 是 这 些 模 块 之 一 ， 它 是 一 个 易于 使 用 的 蓝牙 无 线 接口 ， 可 用 来 取代 串 行 
电缆 。 

ii 7 Ae HH Ericsson 于 1994 年 开发 出 来 的 无 线 通信 标准 ， 用 于 低 功率 、 中 速 、5 ~ 100 米 距 
离 的 通信 ， 这 取决 于 发 射 器 功率 级 别 。 它 通常 用 于 连接 手机 听 简 或 计算 机 键盘 。 不 同 于 红外 线 
通信 和 链 路 ， 它 不 要 求 设备 之 间 进 行 直接 视线 连接 。 


蓝牙 工作 在 2.4GHz 的 工业 、 科 学 和 医疗 (Industrial- 表 8-10 ”蓝牙 类 别 
Scientific- Medical, ISM ) 频段 。 它 从 2402MHz 开始 ， 采 用 类别 ”发送 器 功率 (mW) 范围 (m) 
1MHz 间隔 定义 了 79 条 无 线 信 道 。 它 在 这 些 信道 之 间 以 伪 1 100 100 
随机 模型 跳 转 ， 以 便 避 免 与 在 相同 频段 工作 的 其 他 设备 > 2.5 10 
(如 无 线路 由 需 ) 之 间 的 连续 和 干扰。 如 表 8-10 Has, WEA 3 l 5 


RITARIT 3 类 功率 水 平 ， 它 说 明了 传输 范围 和 功 耗 。 在 

基本 速率 模式 下 ， 它 采用 高 斯 频 移 键 控 (frequency shift 2402.1 
keying, FSK) 工作 在 1Mbit/s。 在 普通 FSK 中 ， 每 个 位 通 
过 发 送 fe tfd 的 频率 来 传递 ， 其 中 fc 是 信道 中 心 频率 ,fd 
是 偏 移 量 ， 至 少 为 115kHz。 位 间 的 频率 突然 转变 占用 额 M E 


FSK 


2402 


f(MHz) 


外 的 审 宽 。 在 高 斯 FSK 中 ， 对 频率 变化 进行 平滑 处 理 ， 以 dst i 4 5 6 
更 好 地 利用 频谱 。 图 8-55 显示 2402MHz 信道 中 传输 0 和 1 3 l 
序列 的 频率 ， 分 别 使 用 FSK 和 GFSK。 8-55 FSK 和 GFSK 波形 


BlueSMiRF Silver 模块 ， 如 图 8-56 所 示 ， 在 一 个 带 有 串 行 接口 的 小 卡 上 包含 类 2 蓝牙 无 线 、 
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VaV Ak Eo E-A A a E) PC 的 蓝牙 USB ) 适 配 融 进行 通信 。 因 
此 ， 它 可 以 在 PIC32 和 PC 之 间 提 供 一 个 无 线 串 行 链 路 ， 与 图 8-43 的 链 路 类 似 但 没有 电缆 线 。 
图 8-57 展示 了 这 种 链 路 的 电路 图 。BlueSMiRF 的 TX 引 脚 连接 到 PIC32 的 RX 引 脚 ， 反 之 亦 然 。 
RTS 和 CTS 引 脚 连接 ， 这 样 BlueSMiRF 能 目 己 完成 握手 。 





a) 
K] 8-56 BlueSMiRF 模块 和 USB 适配器 


PIC BlueSMiRF 





A] 8-57 蓝牙 PIC32 到 PC HER 


BlueSMiRF 默认 为 115. 2k Baud, 8 个 数据 位 、1 个 停止 位 、 无 奇偶 校 验 或 流 控制 。 它 工作 
在 3.3V 数字 逻辑 电 平 ， 所 以 RS-232 收发 器 不 需要 与 男 一 个 3.3V 设备 连接 。 

为 了 使 用 该 接口 ， 将 USB 蓝牙 插入 PC。 启 动 PIC32 和 BlueSMiRF。BlueSMiRF 上 的 红色 
STAT 指示 灯 将 闪烁 ， 表 明 它 正在 等 待 建立 连接 。 打 开 PC 系统 托盘 中 的 蓝牙 图 标 ， 使 用 “添加 
蓝牙 设备 向 导 ”(Add Bluetooth Device Wizard) 来 配对 适配器 和 BlueSMiRF。BlueSMiRF 的 默认 
配对 码 为 1234。 注 意 哪 个 COM 端口 分 配给 适配器 。 然 后 ， 就 像 使 用 串 行 电缆 一 样 进行 通信 。 
需要 注意 的 是 蓝牙 适配器 通 稼 工作 在 9600 波 特 ， 必 须 对 PuTTY 进行 相应 的 配置 。 

4. 电动 机 控制 

微 控 制 器 的 另 一 个 主要 应 用 是 驱动 执行 器 ， 例 如 电动 机 。 本 节 描 述 3 种 类 型 的 电动 机 : 直 
流 电动 机 (DC motor) 、 伺 服 电动 机 (servo motor) 和 步 进 电动 机 (stepper motor) 。 直 流 电动 机 需要 
高 驱动 电流 ， 所 以 强大 的 驱动 ， 如 HH 桥 (H-bridge) ， 必 须 连 接 微 控制 器 和 电动 机 。 它 们 还 需要 
一 个 单独 的 轴 角 编码 器 (shaft encoder) ， 如 果 用 户 想 要 知道 电动 机 的 当前 位 置 。 伺 服 电动 机 接 
收 一 个 脉冲 宽度 调制 信号 以 便 在 有 限 的 角度 范围 内 指定 位 置 。 它 们 很 容易 连接 ,但 不 那么 强 
大 ， 也 不 适合 连续 旋转 。 步 进 电动 机 接收 脉冲 序列 ， 每 个 脉冲 信号 将 电动 机 转动 一 个 固定 角 
度 ， 称 为 一 步 。 它 们 更 昂贵 ， 也 需要 一 个 H 桥 来 驱动 大 电流 ,但 可 以 精确 地 控制 位 置 。 

电动 机 引入 大 量 电流 ， 并 可 能 在 电源 引入 干扰 数字 逻辑 的 毛刺 。 减 轻 这 个 问题 的 一 种 方法 
是 对 电动 机 和 数字 逻辑 使 用 不 同 电源 或 电池 。 

5. 直流 电动 机 

图 8-58 展示 了 一 个 有 刷 直流 电动 机 的 操作 。 电 动机 是 双 终 端 装置 。 它 包含 称 为 定子 的 永 
的 久 固 定 磁 铁 和 连接 在 轴 上 的 称 为 转子 (rotor) 或 电 枢 (armature) 的 旋转 电磁 铁 。 转 子 的 前 端 连 
接 到 一 个 裂 开 的 金属 环 ， 为 换 向 器 (commutator) 。 连 接 到 电源 接头 (输入 终端 ) 的 金属 刷 摩擦 换 
向 器 ， 为 转子 的 电磁 体 提 供电 流 。 这 给 转子 引入 磁场 使 其 旋转 以 便 对 准 定 子 磁 场 。 一 旦 转子 接 
近 并 对 准 定子 ， 电 刷 摩 擦 换 向 器 的 反面 ， 反 转 电 流 和 磁场 使 其 继续 一 直 旋转 。 
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图 8-58 ”直流 电动 机 


直流 电动 机 倾向 于 用 非常 低 的 转 矩 以 每 分 钟 千 转 ( Rotations Per Minute, RPM) 的 速度 旋转 。 
大 多 数 系统 添加 齿轮 条 来 将 速度 降低 到 较 合理 水 平 ， 同 时 增加 转 矩 。 寻 找 能 紧密 配合 你 的 电动 
机 的 齿轮 条 。Pittman 生产 种 类 繁多 的 高 品质 直流 电动 机 和 配件 ， 而 价格 低廉 的 玩具 电动 机 很 
受 发 烧 友 欢迎 。 Vc 

直流 电动 机 需要 大 量 的 电流 和 电压 来 给 负载 提供 提供 了 显著 的 功率 。 oem | 
HE A SOW LAE NL a ERS, ABA HA LMT AT, KE HR A HE“ 
生 直接 驱动 直流 电动 机 的 足够 的 电流 。 相 反 ， 它 们 使 用 互 桥 ， 它 概念 上 包 HOH 
含 4 个 电 控制 开关 ， 如 图 8-59a 所 示 。 如 果 开 关 A 和 D 闭合 ， 则 电流 从 左 p 
向 右 流 过 电动 机 ， 并 向 一 个 方向 旋转 。 如 果 B 和 C 闭合 ， 则 电流 从 右 向 左 。 一 一 二 一 一 
流 过 电动 机 ， 并 向 另 一 个 方向 旋转 。 如 果 A 和 (C 或 B 和 D 闭合， 则 电动 机 a) 
两 端的 电压 强制 为 0， 使 电动 机 主动 制 动 。 如 果 没 有 一 个 开关 闭合 ， 则 电动 了 
机 会 慢 慢 停止 。H 桥 的 开关 是 功率 晶体 管 。 互 桥 还 包含 一 些 数字 逻辑 来 方 
便 地 控制 开关 。 当 电动 机 的 电流 突然 改变 时 ， 电 动机 电磁 体 的 电感 将 感应 人 i 
一 个 大 电压 ， 它 可 能 超过 电源 大 小 而 损坏 功率 晶体 管 。 因 此 ， 许 多 卫 桥 还 


具有 平行 于 开关 的 保护 二 极 管 ， 如 图 8-59b 所 示 。 如 果 感 应 的 冲击 驱动 电 pg 
机 的 某 个 终端 高 于 了 .或 低 于 地 线 ， 二 极 管 将 转 为 ON 并 将 电压 保持 在 一 


个 安全 水 平 。H 桥 可 能 消耗 大 量 功 率 ， 可 能 需要 散热 器 来 保持 冷却 。 b) 
自主 小 车 图 8-59 H$ 


设计 一 个 由 PIC32 控制 两 个 驱动 电动 机 的 机 器 人 汽车 系统 。 写 一 个 函数 库 来 初始 化 电动 机 
驱动 器 ， 使 车 向 前 和 辐 后 行驶 、 左 转 或 右 转 、 停 止 。 使 用 PWM 来 控制 电动 机 的 速度 。 

解 : 图 8-60 展示 了 一 对 受挫 于 PIC32 的 直流 电动 机 ， 它 采用 Texas Instruments SN754410 双 
H 桥 。H 桥 需 要 5V 逻辑 电源 Vg, 和 4.5 ~36V 电动 机 电源 Voo, EM Vy =2V， 因 此 与 PIC32 的 
3.3V LO 兼容 。 它 可 以 为 每 个 电动 机 提供 高 达 1A 的 电流 。 表 8-11 描述 了 每 个 卫 桥 的 输入 如 
何 控制 电动 机 。 微 控制 器 使 用 PWM 信号 驱动 使 能 信号 来 控制 电动 机 的 速度 。 它 驱动 其 他 4 个 
引 脚 来 控制 每 个 电动 机 的 方向 。 


表 8-11 H 桥 控 制 
EN12 1A 2A 电动 机 
0 X X 滑行 
l 0 0 制 动 
1 0 l 反 向 
I 1 0 正 向 
| 1 zt 
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PIC SN754410 H 桥 5V 
OC1/RDO 46 


一 一 







图 8-60 电动 机 控制 与 双阳 桥 


将 PWM 的 工作 效率 配置 为 大 约 781Hz， 占 空 比 为 0% ~ 100% 。 
#include <P32xxxx.h> 


void setspeed(int dutycycle) { 


OC1RS=dutycycle; // set duty cycle between 0 and 100 
} 


void setmotorleft(int dir) { // dir of 1= forward, 0 = backward 
PORTDbits.RD1 = dir; PORTDbits.RD2 = !dir; 
} 


void setmotorright(int dir) I // dir of 1= forward, 0=backward 
PORTDbits.RD3 = dir; PORTDbits.RD4 = !dir; 
} 


void forward(void) { À 
setmotorleft(1); setmotorright(1); // both motors drive forward 
} 


void backward(void) { 
setmotorleft(0); setmotorright(0); // both motors drive backward 
} 


void left(void) { 
setmotorleft(0); setmotorright(1); // left back, right forward 
} 


void right(void) { 
setmotorleft(1); setmotorright(0); // right back, left forward 
} 


void halt(void) { 
PORTDCLR = OxOOI1E; // turn both motors off by 
// clearing RD[4:1] to 0 
} 


void initmotors(void) { 
TRISD = OxFFEO; // RD[4:0] are outputs 
halt(); // ensure motors aren’t spinning 
// configure PWM on 0C1 (RDO) 
T2CONbits.TCKPS = 0b111; // prescale by 256 to 78.125 KHz 


PR2 = 99; // set period to 99+1 ticks = 781.25 Hz 
OC1RS = 0; // start with low H-bridge enable signal 
OC1CONbits.OCM=0b110; // set output compare 1 module to PWM mode 
T2CONbits.ON=1; // turn on timer 2 


OC1CONbDits.ON=1; // turn on PWM 
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在 前 面 的 例子 中 ,没有 办 法 测量 每 个 电动 机 的 位 置 。 两 个 电动 机 不 可 能 精确 匹配 ， 所 以 一 
个 可 能 比 另 一 个 转 得 稍 快 一 些 ,使 机 器 人 小 车 逐渐 偏离 方向 。 为 了 解决 这 个 问题 ， 有 些 系统 添 
加 了 轴 编 码 器 。 图 8-61a 展示 了 一 个 简单 的 轴 编 码 器 ， 它 由 安装 在 电动 机 轴 上 的 带 有 村 的 圆 盘 
组 成 。 将 一 个 LED 放置 在 一 边 ， 将 一 个 光 传 感 器 放置 在 另 一 边 。 每 次 槽 间隙 旋转 经 过 LED 时 ， 
轴 编 码 器 生成 一 个 脉冲 。 微 控制 器 通过 计算 这 些 脉冲 数 来 测量 轴 旋 转 所 转 过 的 总 角度 。 使 用 相 
隔 半 个 槽 宽度 放置 的 两 个 LED/ 传 感 器 对 ， 改 进 的 轴 编 码 器 可 以 产生 图 8-61b 所 示 的 正 交 输出 ， 
它 表 示 轴 旋转 的 方向 和 转 过 的 角度 。 有 时 ， 轴 编码 器 增加 另 一 个 孔 来 表示 轴 什 么 时 候 处 于 索引 
位 置 。 

6. 伺服 电动 机 

伺服 电动 机 是 集成 了 齿轮 组 、 轴 编码 器 和 一 些 控制 逻辑 的 直流 电动 机 ， 因 此 它 更 容易 使 
用 。 它 们 的 旋转 角度 有 限 ， 通 常 为 180。。 图 8-62 展示 了 打开 盖子 的 伺服 电动 机 。 伺 服 电动 机 
使 用 3 引 脚 接 口 : 电源 (通常 为 SV) 、 接 地 以 及 控制 输入 端 。 控 制 输入 通常 是 50Hz 脉冲 宽度 调 
制 信号 。 伺 服 电动 机 的 控制 逻辑 驱动 轴 转 动 到 由 控制 输入 的 占 空 比 所 确定 的 位 置 。 伺 服 电动 机 
的 轴 编 码 器 是 典型 旋转 式 电位 器 ， 它 依赖 于 轴 的 位 置 产生 电压 。 





a) 圆 盘 b) 正 交 输出 
图 8-61 轴 编 码 需 图 8-62 SG90 伺服 电动 机 

在 一 个 以 180 度 旋转 的 典型 伺服 电动 机 中 ，0. Sms 脉冲 宽度 驱动 轴 旋 转 到 0°，1.5ms 脉冲 

宽度 驱动 轴 旋 转 到 90°， 而 2. Sms 脉冲 宽度 驱动 轴 旋 转 到 180°, Pian, 8-63 展示 了 1. Sms hk 

冲 宽度 的 控制 信号 。 驱 动 伺服 电动 机 超过 它 的 范围 可 能 导致 电动 机 撞击 机 械 制 动 并 损坏 。 何 服 

的 电源 来 目 电源 引 脚 ， 而 不 是 控制 引 脚 ， 因 此 控制 可 以 直接 连接 到 微 控制 句 ， 而 不 使 用 吾 桥 。 

伺服 电动 机 通 第 用 于 远程 控制 模型 飞机 和 小 型 机 器 人 ， 因 为 它们 小 、 轻 和 方便 。 找 到 具有 充足 

数据 手册 的 电动 机 可 能 是 困难 的 。 带 红线 的 中 心 引 脚 通常 是 电源 ， 而 黑色 或 柠 色 线 则 通常 
接地 。 


1.5ms 脉 冲 宽度 





20ms 周 期 (50Hz) 
图 8-63 伺服 控制 波形 


伺服 电动 机 

设计 一 个 系统 ， 它 使 用 PIC32 微 控 制 器 来 驱动 伺服 电动 机 旋转 
到 所 需 的 角度 。 

解 : 图 8-64 展示 了 一 个 连接 到 SG90 伺服 电动 机 的 示意 图 。 僻 
服 电机 使 用 4. 0 ~7.2V 电源 工作 。 只 需要 一 根 电线 来 传递 PWM 信 
号 ， 它 可 工作 在 5V 或 3.3V 的 逻辑 电 平 。 代 码 使 用 输出 比较 1(Out- 9CIRD04 
put Compare 1) 模块 来 配置 PWM 生成 ， 并 为 所 需 的 角度 设置 相应 的 
占 空 比 。 图 8-64 ”伺服 电动 机 控制 





#include <P32xxxx.h> 


void initservo(void) { // configure PWM-on-OC1 (RDO) 
T2CONDits.TCKPS = 0b111; // prescale by 256 to 78.125 KHz 
PR2 = 1561; // set period to 1562 ticks = 50.016 Hz (20 ms) 
OC1RS = 117; // set pulse width to 1.5 ms to center servo 
OC1ICONbits.OCM=0b110; // set output compare 1 module to PWM mode 
T2CONbDits.ON=1; // turnon timer 2 
OCICONbits.ON=1; // turn on PWM 


} 


void setservo(int angle). { 
if (angle < 0) angle =0; // angle must be in the range of 
// 0-180 degrees 
else if (angle > 180) angle = 180; 
OC1RS = 39+angle*156.1/180; // set pulsewidth of 39-195 ticks 
// (0.5-2.5 ms) based on angle 
} a 
另外 ， 也 可 以 将 普通 伺服 电动 机 转换 成 连续 旋转 伺服 (contintious rotation servo) 电动 机 : fF 
细 拆 印 它 ， 去 除 机 械 制 动 ， 并 用 固定 分 压 器 代替 电位 计 。 许 多 网 站 说 明了 改造 特定 伺服 电动 机 
的 详细 指导 。 然 后 PWM 将 控制 速度 而 不 是 位 置 ，1. Sms 表示 停止 ，2. Sms 表示 全 速 前 进 ， 而 
0. Sms 则 表示 全 速 后 退 。 连 续 旋 转 伺服 电动 机 可 能 比 结合 互 桥 和 齿轮 系 的 简单 直流 电动 机 更 方 
便 和 更 便宜 。 
7. 步 进 电 动机 
步 进 电动 机 以 离散 步骤 前 进 ， 因 为 脉冲 施加 到 交替 的 输 大 上 。 落 长 通常 是 几 度 ， 人 允许 精确 
定位 和 连续 旋转 。 小 型 步 进 电 机 一 般 都 有 两 组 线圈 ， 称 为 相位 (phase) ， 有 双 极 和 单 极 两 种 方 
式 。 双 极 电 动机 功能 更 强大 ， 相 对 更 便宜 ， 但 需要 一 个 于 桥 驱 动 器 ， 而 单 极 电机 可 使 用 晶体管 
作为 开关 来 驱动 。 本 节 的 重点 是 更 高 效 的 双 极 步 进 电动 机 。 
图 8-65a 展示 一 个 简化 的 两 相 双 极 电动 机 ， 步 长 为 90"。 转 子 是 有 一 个 北极 和 一 个 南极 
的 永久 磁铁 。 定 子 是 包含 两 对 线圈 的 电磁 铁 ， 这 两 对 线 
圈 构 成 两 个 相位 。 两 相 双 极 电动 机 有 4 个 终端 
图 8-65b 显 示 了 步 进 电 动机 的 符号 ， 它 将 两 个 线圈 建 模 
为 电感 器 。 | 
图 8-66 展示 了 两 相 双 极 电动 机 的 3 个 常见 的 驱动 序 
列 。 图 8-66a 阐述 了 波 驱 动 (wave drive) ， 其 中 线圈 通电 
顺序 为 AB 一 CD 一 BA 一 DC。 需 要 注意 的 是 ，BA 表示 绕组 
AB 用 反 向 电流 通电 。 这 来 源 于 双 极 性 (bipolar) 的 名 字 。 





B 
转子 每 一 步 旋 转 90 度 。 图 8-66b 表示 两 相 驱 动 ， 按 如 下 a) 简化 的 双 极 步 进 电动 机 
模式 驱动 : (AB, CD)—(BA, CD)—(BA, DC)—(AB, AT 
DC)。(AB，CD) 表 示 两 个 线圈 AB 和 CD 同时 通电 。 转子 B aaa， 
同样 每 一 步 旋 转 90 度 ， 但 将 自己 对 准 两 个 极 位 置 的 中 间 。 E 
这 可 以 得 到 最 高 的 转 矩 运行 ， 因 为 两 个 线圈 同时 通电 。 ie eee etd 


图 8-66c 演示 了 半 步 驱动 ， 按 如 下 模式 驱动 ;: (AB; 图 8-65 简化 的 两 相 双 极 电动 机 
CD) 一 CD 一 (BA，CcCD) 一 BA 一 (BA，DC) 一 DC 一 (AB，DC ) 一 AB。 转 子 每 半 步 旋转 45 JE. 模 
式 推进 速度 决定 了 电动 机 的 速度 。 为 了 反 转 电动 机 的 方向 ， 按 相反 的 顺序 执行 相同 的 驱动 
序列 。 
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c) 半 步 驱动 
图 8-66” 双 极 电 动机 驱动 


在 真实 的 电动 机 中 ， 转子 具有 许多 极 以 便 使 步骤 之 间 的 角度 很 小 。 例 如 , ,图 8-67 展示 的 
AIRPAX LB82773- M1 双 极 步 进 电动 机 ， 步 长 为 7.5 度 。 电 动机 运行 在 5V， 每 个 线圈 电流 为 0.8A。 


€ 
í - 





Al 8-67 AIRPAX LB82773-M1 双 极 步 进 电动 机 
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确定 。 最 简单 的 操作 模式 称 为 直流 电压 驱动 (direct voltage drive) 5% L/R 驱动 (LZR drive), 其 中 
电压 六 直接 施加 到 线圈 。 电 流 逐 步 上 升 到 T= VR， 上 升 时 间 常 数 由 LVR 设 定 ， 如 图 8-68a 所 


示 。 这 非常 适用 于 慢 速 操作 。 然 而 ， 在 速度 较 高 
的 情况 下 ， 电 流 没 有 是 够 的 时 间 逐 步 上 升 到 满 电 
平 ， 如 图 8-68b 所 示 ， 转 矩 随 之 下 降 。 

驱动 步 进 电动 机 更 有 效 的 方法 是 利用 脉冲 宽度 
调制 较 高 的 电压 。 高 电压 使 电流 更 快 上 升 到 满 电 
流 ， 然 后 关闭 PWM 来 避免 电动 机 过 载 。 然 后 电压 
被 调制 或 斩 波 (chop ) 以 便 使 电流 保持 在 所 需 电 平 的 
附近 。 这 就 是 所 谓 的 斩 波 恒 流 驱动 (chopper constant 
current drive), ， 如 图 8-68c 所 示 。 该 控制 器 使 用 一 个 
小 电阻 与 电动 机 串联 通过 测量 电压 下 降 值 来 感 测 施 
加 的 电流 ， 当 电流 达到 所 需 的 电 平 时 给 H 桥 施 加 使 
能 信号 来 关闭 驱动 。 原 则 上 ， 微 控制 器 可 以 产生 正 
确 的 波形 、， 但 使 用 步 进 电机 控制 硕 更 容易 。ST Mi- 
croelectronics 的 L297 控制 器 是 一 个 方便 的 选择 ， 尤 
其 是 当 加 上 带 有 电流 检测 引 脚 和 2A 峰值 功率 能 力 
的 L298 IUH Afo BÆ, Æ DIP HP L298 不 可 
用 ， 因 此 它 难以 安装 到 试验 电路 板 上 。ST Microe- 
lectronies 的 应 用 笔记 AN460 和 AN470 对 步 进 电动 机 
设计 人 员 来 说 是 有 价值 的 参考 。 

双 极 步 进 电动 机 直接 波 驱动 


l 


a) 缓慢 旋转 


b) 快速 旋转 


c) 用 思 波 驱动 的 快速 旋转 
图 8-68 双 极 步 进 电动 机 直接 驱动 电流 


设计 一 个 系统 ， 其 中 一 个 PIC32 微 控 制 占 采用 直接 驱动 方式 指定 速度 和 方向 来 驱动 AIR- 


PAX 双 极 步 进 电动 机 。 


解 : 图 8-69 显示 了 一 个 由 PIC32 控制 的 H 桥 直接 驱动 的 双 极 步 进 电 动机 。 


SN754410 H 桥 5V 





VCCI1 16 


4A 15 RD3 


来 自 PIC 


图 8-69 ”由 旦 桥 直接 驱动 的 双 极 步 进 电动 机 
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spinstepper K$ k E RF Fl i A HF RD[4:0] 的 模式 初始 化 序列 阵列 。 它 应 
用 序列 中 的 下 过 个 模式 ， 然 后 等 待 足够 的 时 间 以 每 分 钟 所 需 的 转 数 (RPM ) 旋转。 使 用 20MHz 
时 钟 、7:5? 步 长 、16 位 计时 器 和 256: 1 预 分 频 器 ,- 可 用 速度 范围 是 2 ~ 230rpm, 其 最 小 值 受 限 
于 计时 器 分 辨 率 ， 而 最 大 值 受 限于 LB82773-M1 电动 机 的 功率 。 
#include <P32xxxx.h> ! 
#define STEPSIZE 7.5 // size of step, in degrees 
int curstepstate; // keep track of current state of stepper motor in sequence 


void initstepper({void) 1 


TRISD = OxFFEO; // RD[4:0] are outputs 
curstepstate = 0; 
TICONbits.ON=0; // turn Timer1 of f 
TICONbDits.TCKPS = 3; // prescale by 256 to run slower 

} 

void spinstepper(int dir, int steps, float rpm) {> - // dir =0 for forward, 1 = reverse 


int sequence[4] = 40600011, 0b01001, 0b00101, 0b10001}; // wave drive sequence 
int step; 


PR1 = (int) (20.0e6/(256*(360.0/STEPSIZE)*(rpm/60.0))); // time/step w/ 20 MHz peripheral clock 
TMR1 = 0; 


TICONbDits.ON=1; //. turn Timerl on 

for (step =0; step < steps; stept++) i // take specified number of steps 
PORTD = sequence[curstepstate]; // apply current step control 
if (dir ==0) curstepstate= (curstepstate+1)%4; // determine next state forward 
else . curstepstate = (curstepstate + 3) % 4; // determine next State backward 
while (!IFSObits.T1IF); // wait for timer to overflow 
IFSObits.T1IF = 0; // clear overflow flag 

| 

T1CONbits.ON=0; // Timerl off to save power when done 


} 
4 


8.7 PC IO 系统 


个 人 计算 机 (PC ) 使 用 各 种 .IO 协议 ， 这 些 协 议 可 以 用 于 存储 器 、 磁 盘 、 网 络 、 内 扩展 卡 
和 外 部 设备 。 这 些 IO 标准 已 经 发 展 到 可 以 提供 非常 高 的 性 能 ， 很 容易 让 用 户 添 加 设备 。 这 些 
属性 以 ZO 协议 的 复杂 度 为 代价 。 本 节 探 索 在 PC 上 使 用 的 主要 IO 标准 , 考察 将 PC 连接 到 定 
制 的 数字 逻辑 或 其 他 外 部 硬件 的 选项 。 

图 8-70 显示 了 一 个 包含 Core iS a i7 处 理 器 的 PC 主板 。 该 处 理 器 用 1156 镀金 垫 封装 在 一 
个 栅 格 阵列 (land grid array) 中 ， 给 处 理 器 提供 电源 和 接地 ， 并 将 处 理 右 连接 到 存储 器 和 LO 设 
备 。 主 板 包 含 DRAM ARR. AP LO 设备 连接 器 ,以 及 电源 连接 器 、 稳 压 器 和 电容 。 
一 对 DRAM 模块 连接 在 一 个 DDR3 接口 上 。 外 部 设备 (如 键盘 或 摄像 头 ) 通 过 USB 连接 。 高 性 
能 扩展 卡 (如 显卡 ) 通 过 PCI Express x16 插 模 连接， 而 低 性 能 卡 可 以 使 用 PCI Express xl 插 槽 或 
早期 的 PCI 捅 槽 。PC 使 用 以 太 网 插 筷 连接 到 网 络 。 硬 盘 连 接 到 一 个 SATA 端口 。 本 节 的 剩余 内 
容 将 讲述 这 些 IO 标准 的 操作 。 

PC 1/0 标准 的 一 个 重大 进展 是 开发 了 高 速 串 行 链 路 。 至 今 ， 大 多 数 IO 都 是 围绕 并 行 链 路 
构建 的 ， 它 由 一 个 宽 数据 总 线 和 一 个 时 钟 信 号 组 成 。 随 着 数据 速率 的 增加 ， 总 线 内 线路 之 间 的 
延迟 差别 限制 了 总 线 运 行 的 速度 。 此 外 ， 连 接 到 多 个 设备 的 总 线 可 能 带 来 传输 线路 问题 ， 如 信 
号 反射 和 不 同 负载 有 不 同 的 传播 时 间 。 噪 声 也 会 损坏 数据 。 点 到 点 串 行 链 路 消除 了 许多 这 些 问 
题 。 数 据 通常 使 用 差 动 线 对 发 送 。 影 响 配 对 的 两 根 线 的 外 部 噪声 是 不 重要 的 。 传 输 线 很 容易 正 
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确 地 终止 ， 因 此 反射 很 小 ( 见 A. 8 节 )。 没 有 发 送 明 确 的 时 钟 ， 相 反 ， 时 钟 由 接收 器 通过 观察 
数据 传输 转换 的 时 序 来 恢复 。 高 速 串 行 链 路 设计 是 一 个 专门 课题 ， 良 好 的 接口 可 以 在 铜 导线 上 
运行 超过 10Gb/s， 沿 光纤 传输 甚至 更 快 。 


CPU 插 座 1156 


DDR3 内 存 插 槽 







以 太 网 插 孔 一 电源 连接 器 


音频 插 孔 一 | 


-SATA 连 接 器 


图 8-70 -Gigabyte GA- H55MS2V 主板 


8.7.1 USB 


直到 20 世纪 90 年 代 中 期 ， 将 外 设 添 加 到 PC 上 仍然 需要 一 些 技 术 知 识 。 添 加 扩展 卡 需要 
打开 机 箱 ， 设 置 跳 线 到 正确 的 位 置 ， 并 手动 安装 设备 驱动 程序 。 添 加 一 个 RS-232 设备 需要 选 
择 合适 的 电缆 并 正确 配置 波 特 率 、 数 据 、 奇 侦 校 验 位 和 停止 位 。 通 用 串 行 总 线 ( Universal Serial 
Bus, USB) 由 Intel, IBM, Microsoft 等 共同 开发 ， 通 过 将 电缆 和 软件 配置 过 程 标准 化 而 大 大 简 
化 了 添加 外 围 设备 的 过 程 。 现 在 每 年 售 出 数 十 亿 个 USB 外 设 。 

USB 1.0 发 布 于 1996 年 。 它 采用 四 线 简 单 电 缆 : SV. GND 和 一 个 差 动 线 对 以 来 携带 数据 。 
电缆 是 不 可 能 反 向 或 倒置 插入 的 。 它 的 工作 频率 高 达 12Mb/ss 二 个 设备 可 以 从 SB 端口 引出 
高 达 500mA 的 电流 ， 所 以 键盘 、 鼠 标 和 其 他 外 围 设备 可 以 从 端口 获得 所 需 的 电源 ,而 不 必 通 
过 电池 或 独立 电源 线 。 | 

USB 2.0， 发 布 于 2000 年 , ;通过 大 幅 提高 差 动 线 的 运行 速度 来 使 速度 加 快 到 40MBXs。 使 
用 更 快 的 链 路 ，USB 实际 用 于 连接 摄像 关 和 外 部 硬盘 。 带 USB Be HAAR REE FE 
计算 机 之 间 传 输 文件 的 手段 。 

USB 3.0， 发 布 于 2008 年 ， 进 一 步 将 速度 提高 到 5Gb/s。 它 使 用 相同 形状 的 连接 器 ,但 电 
缆 具 有 高 速 运行 的 多 根 导线 。 它 更 适合 于 连接 高 性 能 硬盘 。 同 时 ，USB 增加 了 一 个 电池 充电 规 
范 ， 它 增强 了 由 端口 提供 的 电源 ， 从 而 加 快 移动 设备 的 充电 。 

对 于 用 户 而 言 的 简单 性 ， 以 更 复杂 的 硬件 和 软件 实现 为 代价 。-: 从 头 开 始 建立 一 个 'USB 接 
口 是 一 个 大 工程 。 即 使 写 一 个 简单 的 设备 驱动 程序 也 是 很 复杂 的 。PIC32 带 有 一 个 内 置 USB 控 
制 器 。 然 而 , 连接 鼠标 和 PIC32 的 Microchip 设备 驱动 程序 ( 巩 microchip.idom) 超 过 了 500 行 
代码 ;而 且 超 出 了 本 章 的 范围 。 
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8.7.2 PCI 4 PCI Express 


9} 7% 48 4+ & i ( Peripheral Component Interconnect, PCI) 总 线 是 由 Intel 开发 的 扩展 总 线 标 
HE, CE 1994 年 前 后 普及 。 它 是 用 来 增加 扩展 卡 ， 如 额外 的 串 行 或 USB mO., MIH, 
声卡 、 调 制 解 调 器 、 磁 盘 控制 器 或 视频 卡 s 32 位 并 行 总 线 运行 频率 为 33MHz， 具 有 133MB/s 
的 带宽 。 

对 PCI 扩展 卡 的 需求 已 经 稳步 下 降 。 更 多 标准 接 日 (如 以 太 网 和 SATA ) 集 成 到 主板 上 。 许 
多 曾经 需要 扩展 卡 的 设备 现在 可 以 通过 快速 USB 2.0 或 3.0 PERRIER, 视频 卡 现在 需要 大 大 超 
过 PCI 可 以 提供 的 带宽 。 

现代 的 主板 往往 还 是 有 少数 PCI jA, BERERE, WMF, ME PCI Express 
(PCIe) 连 接 。PCI Express 插 槽 提供 了 一 个 或 多 个 高 速 串 行 链 路 通道 。 在 PCIe 3.0 中 ， 每 个 通 
道 的 运行 速度 高 达 8Gb/s。 大 多 数 主板 提供 x16 插 柳 ，16 个 通道 为 大 流量 数据 设备 (如 视频 卡 ) 
提供 总 共 16GB/s HY Fe 


8.7.3 DDR3 AF 


DRAM 通过 并 行 总 线 连 接 到 微 处 理 器 。2012 年 ， 标 准 是 DDR3 ， 第 三 代 双 倍数 据 速 率 存 储 
器 总 线 工作 在 1. 5V 电压 。 典 型 主板 现在 配备 了 2 条 DDR3 通道 ， 使 它们 可 以 同时 访问 两 组 内 
存 模块 。 

图 8-71 显示 了 一 个 46B 的 DDR3 双 列 直 搬 内 存 模块 (DIMM ) 。 该 模块 每 边 具 有 120 个 触 
点 ， 总 共有 240 个 连接 ， 包 括 一 个 64 位 数据 总 线 、 一 个 16 位 时 分 多 路 复 用 地 址 总 线 、 控 制 信 
号 ， 以 及 许多 电源 和 接地 引 脚 。2012 年 ，DIMM 典型 地 装载 1~16GB 的 DRAM。 内 存 容量 每 两 
三 年 增加 一 倍 左右 。 





图 8-71 DDR3 内 存 模块 


DRAM 当前 工作 在 100 ~ 266MHz 时 钟 速率 。 DDR3 以 4 倍 于 DRAM 的 时 钟 速率 操作 存储 器 
总 线 。 而 且 ， 它 在 时 钟 的 上 升 沿 和 下 降 沿 都 传送 数据 。 因 此 ， 它 在 每 个 存储 器 时 钟 发 送 8 个 字 
的 数据 。 如 果 64 位 / 字 ， 这 就 对 应 于 6.4 ~17CB/s 带宽 。 例 如 ，DDR3-1600 使 用 一 个 200MHz 
的 内 存 时 钟 和 800MHz 的 WO 时 钟 来 发 送 16 亿 字 / 秒 ,， 或 12 800MBXs。 因 此， 该 模块 也 称 为 
PC3-12800, 但 是 ,DRAM 的 延迟 依然 很 高 ， 从 一 个 读 请 求 直 到 数据 的 第 一 个 字 的 到 来 有 大 和约 
50ns ÉJ JE o 


8. 7.4 .网络 


计算 机 通过 网 络 接口 连接 到 因特网 ( Internet)， 这 个 接口 运行 传输 控制 协议 和 网 际 协议 
(Transmission Control Protocol and Internet Protocol ，TCP/ 耻 )。 物 理 连 接 可 以 通过 以 太 网 电线 或 
无 线 Wi-Fi ER. 

以 太 网 是 由 EEE 802.3 标准 定义 的 。 它 于 1974 年 在 Xerox Palo Alto 研究 中 心 (PARC ) FF 
发 。 它 最 初 运行 在 10Mb/s (所谓 的 10 兆 以 太 网 ) ， 但 是 现在 通常 发 现 它 以 100 JE ( MB/s) 和 
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1 千 兆 (GB/s)， 运行 在 含有 4 对 双 绞 线 的 5 类 电 绕 上 。 在 光纤 上 运行 的 10 千 兆 (Gbit) 以太 网 
在 服务 器 和 其 他 高 性 能 计算 中 上 日益 普及 ， 而 100 千 兆 ( Chit) 以 太 网 正在 形成 。 

Wi-Fi 是 IEEE 802. 11 无 线 网 络 标准 的 通用 称呼 。 它 工作 在 2. 4GHz 和 5GHz 非 授 权 无 线 频 
市 ， 意 味 着 用 户 不 需要 无 线 电 操作 员 执 照 就 可 以 在 这 些 频 带 以 低 功 率 发 送 数据 。 表 8-12 总 结 
了 三 代 Wi-Fi 的 能 力 ， 新 兴 的 802. 11ac 标准 承诺 使 用 超过 1Gb/s 的 传输 速率 推送 无 线 数据 。 日 
益 增 加 的 性 能 来 自 先进 的 调制 和 信号 处 理 、 多 重 天 线 和 更 宽 的 信号 带宽 。 


表 8-12 802.11 Wi-Fi 协议 


协议 发 布 年 份 频带 (GHz ) 数据 速率 ( Mb/s ) 范围 (m) 
802. 11b 1999 2.4 5.5~11 35 
802. 11g 2003 2.4 6 ~54 38 
802. 11n 2009 2, 4/5 7.2 ~150 70 
8.7.5 SATA 


内 部 硬盘 需要 一 个 连接 到 PC 的 快速 接口 。1986 Æ, Western Digital 推出 了 集成 驱动 电子 (In- 
tegrated Drive Electronics，IDE ) 接口 ， 它 演变 成 AT 附件 (AT Attachment，ATA ) 标 准 。 该 标准 使 用 
一 个 笨重 的 40 或 80 线 带 状 电缆 ， 最 大 长 度 为 18 英寸， 以 16MBXs ~133MB/s 速率 发 送 数据 。 

ATA 已 被 品行 ATA(Serial ATA, SATA) 取代，SATA 使 用 高 
速 串 行 链 路 通过 更 方便 的 7 芯 电缆 电线 以 1.5、3 或 6Gb/s 的 速率 
运行 ， 如 图 8-72 所 示 。2012 年 ， 最 快 的 固态 硬盘 可 接近 SOOMB/s 
的 带宽 ， 充 分 利用 了 SATA 的 优势 。 

一 个 相关 标准 是 品行 连接 SCSI( Serial Attached SCSI, SAS), 
它 是 并 行 SCSI( Small Computer System’ Interface ) 接口 的 演化 。SAS 
提供 了 与 SATA BY HRA PERE, FRSC RRMA. ETERS ait 
计算 机 中 很 常见 。 à 


8.7.6 i722 PC 


目前 描述 的 所 有 PC LO 标准 都 为 了 高 性 能 和 易于 连接 而 优化 ， 但 很 难 在 硬件 中 实现 。 工 
程 师 和 科学 家 经 常 需 要 某 种 方法 将 PC 连接 到 外 部 电路 ， 如 传感器 、 执 行 器 、 微 控制 器 或 了 PCA 
等 。8. 6.3 节 描 述 的 串 行 连接 可 以 用 于 连接 微 控 制 器 与 UART 之 间 的 低速 连接 。 本 节 将 介绍 其 
他 两 种 方法 : 数据 采集 系统 和 USB 链 路 。 

1. 数据 采集 系统 

数据 采集 系统 (Data Acquisition System, DAQ) 使 用 多 个 模拟 和 数字 IO 通道 将 计算 机 与 现 
实 世界 连接 起 来 。 DAQ 现在 通常 作为 USB 设备 使 用 ， 这 使 得 它们 易于 安装 。National Instru- 
ments( NI) 是 一 家 领先 的 DAQ 制造 商 。 

高 性 能 DAQ 的 价格 往往 高 达 数 千 美 元 ， 主 要 是 因为 市 场 小 而 限制 了 竞争 。 幸 运 的 是 ， 
2012 年 ，NI 以 200 美元 的 学 生 折 扣 价 出 售 便于 和 使 用 的 myDAQ 系统 ,包括 了 LabVIEW 软件 。 
图 8-73 展示 了 myDAQ。 它 包含 输入 和 输出 两 个 模拟 通道 ， 具 有 200ksamples/s 的 采样 频率 、16 
位 分 辩 率 和 +10V 动态 范围 。 这 些 通道 可 被 配置 为 示波器 和 信和 号 发 生 器 。 它 还 有 8 条 数字 输入 
和 输出 线 ， 可 与 3.3V 和 5V 系统 兼容 。 此 外 ， 它 产生 +5V、+15V 和 -15V 电源 输出 ， 并 包括 
能 够 测量 电压 、 电 流 和 电阻 的 数字 万 用 表 。 因 此 ，myDAQ 可 取代 整套 试验 和 测量 设备 ， 它 能 
同时 自动 记录 数据 。 


图 8-72 SATA 电缆 
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图 8-73 NI myDAQ 


大 多 数 NI DAQ 使 用 LabVIEW 控制 ， 它 是 NI 的 图 形 语言 ， 用 于 设计 测量 和 控制 系统 。 有 
些 DAQ 也 可 以 在 LabWindows 环境 中 使 用 C 程序 控制 ， 在 Measurement Studio 环境 中 使 用 
Microsoft. NET 应 用 程序 控制 ， 或 者 在 Data Acquisition Toolbox 中 使 用 Matlab 控制 。 

2. USB 链 路 

越 来 越 多 种 类 的 产品 通过 USB 为 PC 和 外 部 便 件 之 间 提 供 简单 、 价 格 低廉 的 数字 链 路 。 这 些 产 
品 含有 预 开发 的 驱动 程序 和 库 ， 人 允许 用 户 轻松 地 在 PC 上 编写 程序 在 FPGA 或 微 控制 器 读 / 写 数据 。 

FTDI 是 此 类 系统 的 领先 供应 商 。 例 如 ， 图 8-74 显示 了 FTDI C232HM- DDHSL USB 到 多 协 
议 同 步 串 行 引 擎 (MPSSE ) 的 电线, :电缆 的 一 端 是 USB 插 和 孔 ， 而 男 一 端 是 一 个 工作 频率 高 达 
30Mb/s 的 SPI 接口 ， 以 及 3.3V 电源 和 4 个 通用 IO. 引 脚 。 图 8-75 展示 了 使 用 电线 将 PC 连接 
到 FPGA 的 例子 。 电 缆 可 以 选择 提供 3.3V 电源 给 FPGA 供电 。 这 3 个 SPI 引 脚 像 例 8. 19 那样 
连接 到 FPGA 从 设备 上 。 该 图 还 显示 了 用 于 驱动 LED 的 一 个 GPIO 引 脚 。 






(红色 )” VCC1 
(橙色 ) SCK 2 
(黄色 ) ”SDO3 
(绿色 ) SDI4 
(灰色 ) GPIO0 6 
(黑色 ) GND 10 


图 8-74 FTDI USB 到 MPSSE 的 电线 图 8-75. C232HM-DDHSL USB 到 MPSESE 
(©2012 by FTDI, AHHH) 接口 (从 PC 到 FPGA) 


PC 要 求 安装 D2XX 动态 链接 库 驱 动 程序 。 然 后 ， 你 就 可 以 使 用 该 库 编写 一 个 € 程序 在 电 
绕 上 发 送 数 据 。 

如 果 需 要 更 快 的 连接 ， 图 8-76 中 的 FTDI UM232H 模块 连接 PC 的 USB 端口 和 一 个 8 位 同 
步 并 行 接口 ， 它 的 工作 频率 高 达 40MB/s。 










来 自 PC USB 端 口 











8-76 FTDI UM232H 模块 
(©2012 by FTDI, AIHA) 
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8.8 从 现实 世界 看 : x86 存储 器 和 1/O 系统 


随 着 处 理 器 速度 越 来 越 快 ， 它 们 需要 更 复杂 的 存储 器 层次 结构 来 保持 提供 稳定 的 数据 流 和 
指令 流 。 本 节 介 绍 x86 处 理 咒 的 存储 器 系统 来 说 明 这 个 发 展 过 程 。7.9 节 中 的 处 理 器 照片 突出 
显示 了 片上 高 速 缓存 。x86 还 使 用 了 一 个 与 大 部 分 常见 内 存 映射 VO 不 同 的 直接 IO 编程 方式 。 


8.8.1 x86 高 速 缓存 系统 


1985 年 开始 生产 的 80386 以 16MHz 的 频率 工作 。 它 没有 高 速 缓存 ， 所 以 它 直 接 访 问 主 存 
以 便 获取 所 有 的 指令 和 数据 。 根 据 存储 器 的 速度 ， 处 理 器 可 能 立即 得 到 响应 ， 也 可 能 会 暂停 TE 
1 ~2 周期 来 等 待 内 存 响 应 。 这 些 等 待 的 周期 称 为 等 待 状态 (wait states)， 它们 将 增加 处 理 器 的 , 
CPI。 从 那 时 开始 ， 微 处 理 器 的 频率 每 年 都 提高 至 少 25% ， 然 而 内 存 延 迟 并 没有 降低 。 从 处 理 504 
器 向 主 存 发 出 地 址 到 主 存 返 回 数据 的 延迟 目前 已 经 超过 100 个 时 钟 周期 。 因 此 ， 低 缺失 率 的 高 
速 缓存 是 提高 性 能 所 必需 的 。 表 8-13 总 结 了 Intel x86 处 理 器 上 高 速 缓存 系统 的 发 展 。 


表 8-13 Intel x86 微 处 理 器 存储 器 系统 的 发 展 


sores |g | as 100 | skh 六 的 | | 

Pein FEL 

= 36KB ~ IMB 
Pei lt | 1997 | 233-450 | i6Kh fim OOO ana 


= 5688-208 RT 

=f aM 

San Da A 

Chre-i7 每 核 32KB 每 核 256KB +4 ~15MB 第 三 级 缓存 


80486 引入 了 一 个 统一 直 写 高 速 缓存 来 保存 指令 和 数据 。 大 多 数 高 性 能 计算 机 系统 使 用 速 
度 大 大 高 于 主 存 的 商业 SRAM 芯片 在 主板 上 提供 了 更 大 的 二 级 高 速 缓存 。 

Pentium 处 理 器 引入 了 单独 的 指令 和 数据 高 速 缓存 ， 防 止 在 同时 请 求 指令 和 数据 时 产生 竞 
争 。 高 速 缓 存 使 用 写 回 策略 来 减少 它 与 主 存 的 通信 。 同 样 ， 在 主板 上 提供 了 一 个 更 大 的 第 二 级 
高 速 缓存 (一 般 为 2356 ~512KB)。 

P6 系列 处 理 器 (Pentium Pro, Pentium II 和 Pentium M) 的 设计 可 以 支持 更 高 的 时 钟 频 率 。 
主板 上 的 第 二 级 高 速 缓存 没 有 继续 保留 ， 因 此 将 它 移 到 与 处 理 器 更 接近 的 位 置 ， 以 便 改 进 其 延 
RME, Pentium Pro 采用 多 芯片 模块 (Multichip Module，MCM) 封 装 ，MCM 包含 处 理 器 芯 
片 和 第 二 级 高 速 缓存 芯片 ， 如 图 8-77 所 示 。 与 Pentium 相似 ， 它 采用 单独 的 8KB 第 一 级 指令 和 
数据 高 速 缓存 。 然 而 ， 这 些 高 速 缓存 是 非 阻塞 的 (nonblocking) ， 这 样 即使 具体 访问 在 高 速 缓存 
中 缺失 且 必 须 从 主 存 中 获取 数据 ， 乱 序 执行 的 处 理 器 仍然 可 以 继续 后 续 的 高 速 缓存 访问 。 第 二 
级 高 速 缓 存 的 容量 为 256KB、512KB, 或 者 1MB ， 并 可 与 处 理 器 相同 的 速度 运行 。 但 是 ， 对 于 大 
批量 的 制造 ， 多 芯片 模块 封装 太 昂 贵 了 。 因 此 Pentium Il 以 包含 处 理 器 和 第 二 级 高 速 缓存 的 低 成 
本 盒 装 发 售 。 第 一 级 高 速 缓存 容量 增加 了 一 倍 ， 以 便 弥补 第 二 级 高 速 缓存 以 处 理 融 一 半 的 速度 运 
行 的 不 足 。Pentium M 在 与 处 理 器 同一 个 芯片 上 直接 集成 了 一 个 全 速 第 二 层 高 速 缓存 。 同 一 芯片 
上 的 高 速 缓存 可 以 以 更 好 的 延迟 和 吞吐 量 运行 ， 它 比 相同 大 小 的 片 外 高 速 缓存 更 有 效率 。 
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图 8-77 PGA 封装 中 的 Pentium Pro 多 芯片 模块 ,左边 为 处 理 器 ， 右 边 为 256KB 高 速 缓存 

(得 到 Intel 公司 许可 ) 

Pentium 4 处 理 器 提供 一 个 非 阻 塞 的 第 一 级 数据 高 速 缓存 。 在 指令 被 译 码 为 微 操 作 后 ， 它 
切换 到 跟踪 高 速 缓存 来 存储 指令 ， 避 免 指 令 每 次 从 高 速 组 取出 后 绸 进行 重复 译 码 的 延迟 。 

Pentium M 处 理 器 的 设计 来 源 于 Pentium II 处 理 器 。 它 大 幅度 地 将 第 一 级 高 速 缓存 容量 增 
加 到 32KB ， 配 置 了 一 个 1 ~2MB 的 第 二 级 高 速 缓存 。Core Duo 包含 两 个 改进 的 Pentium M 处 理 
器 和 一 个 共享 的 2MB 片上 高 速 缓存 。 共 享 的 高 速 缓存 可 用 于 处 理 融 之 间 的 通信 : 一 个 将 数据 
写 人 高 速 缓存 ,- 另 一 个 从 高 速 缓存 中 读 出 数据 。 

Nehalem( Core i3 ~ 这 7 处理 器 设计 增加 子 第 三 级 高 速 缓 存 ， 由 片上 的 所 有 处 理 器 核 共 享 ， 
从 而 方便 核 之 间 的 信息 共享 。 每 个 核 拥 有 自己 的 64KB 第 一 级 高 速 缓存 和 256KB 第 二 级 高 速 组 
存 ， 共 享 4 ~8MB( 或 更 多 ) 第 三 级 高 速 缓存 。 


8.8.2 x86 虚拟 存储 器 


x86 处 理 器 在 实 模式 或 者 保护 模式 下 运行 。 实 模式 (real mode) 向 后 兼容 原始 的 8086。 它 只 
使 用 20 位 地 址 ， 内 存 容量 限制 为 1MB， 不 支持 虚拟 存储 器 。 

80286 中 引入 了 保护 模式 (protected mode) ，80386 将 其 被 扩展 到 32 位 地 址 。 它 支持 4KB 页 
的 虚拟 存储 器 。 它 还 提供 内 存 保护 ， 这 样 一 个 程序 不 能 访问 属于 其 他 程序 的 页 。 因 此 ， 一 个 有 
漏洞 或 者 恶意 的 程序 就 不 能 破坏 或 者 影响 其 他 程序 。 所 有 的 现代 操作 系统 都 使 用 保护 模式 。 

32 位 的 地 址 允许 最 多 4GB 的 存储 器 空间 。 从 Pentium Pro 开始 ， 处 理 器 就 已 经 使 用 物理 地 
址 扩展 (physical address extension) 技术 将 存储 器 容量 扩充 到 64CB。 每 一 个 进程 使 用 32 位 地 址 ， 
虚拟 存储 器 系统 将 这 些 地 址 映射 到 更 大 的 36 位 虚拟 存储 器 空间 。 它 对 每 个 进程 使 用 不 同 的 页 
表 ， 所 以 每 一 个 进程 都 可 以 有 它 自己 的 4GB 地 址 空间 。 

为 了 更 优雅 地 避 开 存储 器 瓶颈 问题 ，x86 升级 至 x86-64， 它 能 提供 64 位 虚 地 址 和 通用 寄存 
器 。 目 前 ， 虚 地 址 只 使 用 了 48 位， 提供 了 256TB 的 虚 地 址 空间 。 当 存储 器 扩展 时 ， 这 个 极限 
可 能 会 扩大 至 全 64 位， 提供 16EB 地 址 空间 容量 。 
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8.8.3 x86 可 编程 MO 


大 多 数 体系 结构 使 用 8. 5 节 描 述 的 内 存 映射 VO 机 制 ， 程 序 以 读 和 写 内 存 位 置 的 方式 访问 
LO 设备 。x86 的 可 编程 IO 采用 专用 的 IN 和 OUT 指令 实现 读 和 写 ORB. x86 定义 2 个 
LO 端口 。I 指令 从 DX 指定 的 端口 读 取 1、2 或 者 4 字 节 到 AL、AX 或 EAX AA 4%. OUT ff 
令 与 之 相似 ， 但 写 人 端口 。 

把 外 围 设备 连接 到 可 编程 /VO 与 把 它 连 接 到 内 存 映 射 系统 很 相似 。 当 访问 一 个 VO 端口 
时 ， 处 理 器 发 送 端 口号 (而 不 是 内 存 地 址 ) 到 地 址 总 线 的 最 低 16 位 。 设 备 从 数据 总 线 读 或 写 数 
据 。 最 大 的 不 同 是 处 理 器 还 产生 一 个 MXIO 信 号 。 当 MXIO = 1 时 ,表示 处 理 器 正在 访问 内 存 。 
当 它 为 0 时 ， 进 程 正在 访问 一 个 0 设备 。 地 址 译 码 器 也 必须 检查 M/IO 信 号 以 便 产生 主 存 和 
YO 设备 合适 的 使 能 信号 。LO 设备 也 可 以 向 处 理 器 发 送 中 断 来 表示 它们 准备 好 通信 。 


8.9 总 结 


存储 器 系统 的 结构 是 决定 计算 机 性 能 的 主要 因素 。DRAM、SRAM 和 硬盘 等 不 同 的 存储 技 
术 在 容量 、 速 度 和 价格 等 3 方面 提供 不 同 的 折 中 。 本 章 介 绍 了 基于 高 速 缓存 和 虚拟 存储 器 的 结 
构 ， 它 们 使 用 存储 器 层次 结构 提供 接近 理想 的 大 容量 、 人 快速、 廉价 的 存储 器 系统 。 主 存 一 般 由 
DRAM 构成 ， 其 速度 明显 比 处理 器 慢 。 高 速 缓存 把 常用 的 数据 保存 在 快速 SRAM 中 以 便 减少 访 
问 时 间 。 虚 拟 存储 器 用 硬盘 存储 暂时 不 需要 在 主 存 中 的 数据 以 便 增加 内 存 容 量 。 高 速 缓存 和 虚 
拟 存储 器 增加 了 计算 机 系统 的 复杂 度 和 硬件 ,但 带 来 的 好 处 通常 大 于 需要 付出 的 成 本 。 所 有 的 
现代 个 人 计算 机 都 使 用 高 速 缓存 和 虚拟 存储 器 。 大 部 分 处 理 器 还 使 用 内 存 接口 与 /0 设备 通 
信 。 这 称 为 内 存 映射 IO。 程 序 使 用 装 入 和 存储 操作 访问 IO 设备 。 


后 记 


这 一 章 把 我 们 带 到 了 数字 系统 世界 旅程 的 终点 。 我 们 希望 本 书 不 仅 让 你 学 习 到 工程 技术 知 
识 ， 也 能 让 你 感受 到 美妙 和 令 人 神往 的 数字 电路 设计 艺术 5 你 学 习 了 如 何 使 用 原理 图 和 硬件 描 
述 语言 来 设计 组 合 和 时 序 逻 辑 ， 熟 悉 了 多 路 复 用 器 、ALU、 存 储 器 等 较 大 的 数字 电路 模块 。 计 
算 机 是 最 吸引 人 的 数字 系统 应 用 之 一 。 你 已 经 学 习 了 如 何 使 用 汇编 语言 对 MIPS 处 理 虎 编程 ， 
如 何 使 用 数字 电路 模块 构造 微 处 理 器 和 存储 器 系统 。 你 可 以 发 现 抽象 、 规 范 、 层 次 化 、 模 块 化 
和 规整 化 等 原则 贯穿 了 全 书 。 通 过 这 些 技术 原则 ， 可 以 完成 微 处 理 器 内 部 运行 这 个 难题 。 从 移 
动 电 话 到 数字 电视 再 到 火星 探测 器 和 医学 影像 系统 ， 我 们 的 世界 日 益 数 字 化 。 

想象 在 一 个 半 世 纪 之 前 查尔斯 * 巴 贝 奇 (Charles Babbage) 试图 制造 一 台 目 动 计算 机 一 一 老 
分 机 所 经 历 的 相似 历程 。 他 只 是 兆 望 以 机 械 精确 度 来 计算 数学 用 表 。 今 天 的 数字 系统 是 昨天 的 
科幻 小 说 。 狄 克 … 崔 西 (20 世纪 30 年 代 美 国 连环 漫画 人 物 ) 曾 在 电话 里 听 说 过 iTunes 吗 ? fits 
勒 " 凡 尔 纳 (19 世纪 法 国 科 幻 作 家 ) 会 发 射 全 球 定 位 卫星 星座 到 太空 中 吗 ? 希 波 克 拉 底 ( 古 希 脂 
物理 学 家 和 医学 家 ) 使 用 过 高 分 辩 率 的 脑 部 数字 照片 治疗 疾病 吗 ? 但 是 同时 ， 罪 犯 声称 可 以 用 
先进 的 便携 计算 机 开发 核武 器 ， 它 的 计算 能 力 比 冷战 时 期 用 于 模拟 炸弹 实验 的 房间 大 小 的 超级 
计算 机 还 强 。 微 处 理 器 的 发 展 和 进步 仍 在 加 速 。 未 来 10 年 的 变化 将 超过 以 往 。 现 在 已 经 有 工 
具 设 计 和 建造 那些 可 以 改造 我 们 未 来 的 新 系统 。 更 高 的 能 力 带 来 更 多 的 责任 。 我 们 希望 你 不 仅 
仅 为 了 娱乐 或 金钱 而 是 为 了 人 类 的 利益 来 利用 它 。 


习题 
8. 1 用 简短 的 语言 描述 4 个 日 常 活动 ， 说 明 时 间 局 部 性 和 空间 局 部 性 5 说 出 每 一 种 局 部 性 的 
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两 个 例子 ， 并 加 以 解释 。 
8.2 用 一 个 段 话 描 述 两 个 可 以 利用 时 间 局 部 性 和 空间 局 部 性 的 计算 机 应 用 。 说 明 原 理 。 
8.3 给 出 一 个 地 址 序列 ， 容 量 为 16 个 字 ， 块 大 小 为 4 个 字 的 直接 映射 高 速 缓存 的 性 能 将 优 于 
具有 同样 容量 和 块 大 小 的 LRU 替换 策略 的 全 相 联 高 速 缓存 。 
8.4 重 做 习题 8.3 的 例子 ， 这 时 全 相 联 高 速 缓存 优 于 直接 映射 高 速 缓存 。 
8.5 在 下 述 高 速 缓存 参数 中 ， 增 加 其 中 一 项 而 保持 其 他 参数 不 变 时 ， 描 述 所 产生 的 性 能 变化 。 
(a) RK 
(b) 相 联 性 
(c) 高 速 缓存 大 小 
8.6 2 路 组 相 联 高 速 缓 存 的 性 能 一 定 比 同样 容量 和 块 大 小 的 直接 映射 高 速 缓存 好 吗 ? 请 解释 。 
8.7 以 下 是 关于 高 速 缓存 缺失 率 的 说 法 。 标 明 每 句 话 是 对 还 是 错 。 简 单 解 释 原 因 ,， 当 说 法 是 
错 的 时 ， 给 出 一 个 反例 。 
(a) 一 个 2 路 组 相 联 高 速 缓存 比 有 同样 容量 和 块 大 小 的 直接 映射 高 速 缓存 有 更 低 的 缺 


失 率 
(b) 一 个 16KB 大 小 的 直接 映射 高 速 缓存 比 有 同样 块 大 小 的 8KB 直接 映射 高 速 缓存 有 更 
“ 低 的 缺失 率 
(e) RADA 32 字 他 的 指令 高 速 缓 存 一 般 比 一 个 8 字 节 块 大 小 且 有 同样 的 相 联 度 和 总 容 
量 的 指令 高 速 缓存 有 更 低 的 缺失 率 


8.8 高 速 缓存 有 以 下 的 参数 : 块 大 小 5( 以 字 为 单位 )、 组 数 S、 路 数 和 NN、 地 址 位 数 4。 
(a) 用 给 出 的 参数 表示 ;高速 缓 存 容量 C 是 多 少 ? 
(b) 用 给 出 的 参数 表示 ; 需要 多 少 位 来 存放 标志 ? 
(c) 全 相 联 高 速 缓存 的 容量 是 C， 块 大 小 是 B， 这 时 5S 和 是 多 少 ? 
(d) 直接 映射 高 速 缓存 的 容量 为 C， 块 大 小 为 9，5 为 多 少 ? 
8.9 16 字 高 速 缓 存 的 参数 如 习题 8.8 给 出 。 考 虑 以 下 重复 的 lw 地址 序列 (以 十 六 进 制 给 出 ): 
40 44 484C 70 74 78 7C 80 84 88 8C 90 94 98 9C 048C1014181C20 
假设 对 相 联 高 速 缓存 采用 最 近 最 少 使 用 ( LRU ) 替换 策略 ， 如 果 将 这 个 地 址 序列 输入 到 以 
下 高 速 缓存 ， 忽 略 开 始 的 影响 (也 就 是 ， 强 制 缺 失 ) ， 计 算 有 效 的 缺失 率 。 
(a) 直接 映射 高 速 缓存 ，! =1 字 
(b) 全 相 联 高 速 缓存 ，b=1 字 
(c) 2 路 组 相 联 高 速 缓 存 , b=1F 
(d) 直接 映射 高 速 缓存 , =2 字 
8.10 ,重复 习题 8. 9。 考 虑 以 下 重复 的 1w 地 址 序列 (以 十 六 进 制 给 出 ) 和 高 速 缓存 配置 。 高 速 
缓存 容量 仍 为 16 字 。 
74 AO 78 38C AC 84 88 8C 7C 34 38 13C 388 18C 
(a) 直接 映射 高 速 缓存 ，b=1 字 
(b) 全 相 联 高 速 缓存 ,b=2 + 
(c) 2 路 组 相 联 高 速 缓存 , b=2 F 
(d) 直接 映射 高 速 缓存 ,b=4 字 
8.11 假设 用 以 下 数据 访问 模式 运行 程序 。 这 个 模式 仅 只 运行 二 次 。 
571 0x0 Ox8 0xl0 Oxl8 0x20 0x28 
(a) 如 果 使 用 直接 映射 高 速 缓存 ， 其 容量 为 1IKB ， 块 大 小 为 8 字 节 (2 F), WAREZ 
存 内 有 多 少 组 ? 
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8. 12 


8. 13 


8. 14 


(b) 使 用 (a) 中 相同 的 高 速 缓存 和 块 大 小 ， 针 对 给 出 的 内 存 访问 模式 ,该 直接 映射 高 速 
缓存 的 缺失 率 是 多 少 ? 

(c) 针对 给 出 的 内 存 访 问 模式 ， 以 下 哪 种 方法 可 以 降低 缺失 率 ? (高 速 缓存 容 量 保持 
不 变 )。 

(i) 增加 相 联 度 为 2。 

Ci) 增加 块 大 小 为 16 字 节 。 
(il) (1) AC 二) 都 可 以 。 
Civ) (1 ) 和 (让) 都 不 可 以 。 

你 正在 为 MIPS 处 理 器 设计 一 个 指令 高 速 缓存 。 它 的 总 容量 为 4C=2°“ 字 节 , 采用 N= 

2 "路 组 相 联 (CW>8) ， 块 大 小 为 =2 字 节 (b=8)。 根 据 这 些 参 数 给 出 以 下 问题 的 答案 。 

(a) 地 址 的 哪些 位 用 于 选择 块 中 的 字 ? 

(b) 地 址 的 哪些 位 用 于 选择 高 速 缓存 中 的 组 ? 

(e) 每 一 个 标志 有 多 少 位 ? 

(d) 整个 高 速 缓存 中 有 多 少 标志 位 ? 

考虑 以 下 参数 的 高 速 缓存 : NRE) =2, DORK) =2 字 ,，W( 字 大 小 ) =32 位 ，C 

(高 速 缓存 大 小 ) =32K 字 ，4( 地 址 大 小 ) =32 位 。 只 需要 考虑 一 个 字 地 址 。 

(a) 给 出 地 址 中 的 标志 、 组 、 块 偏 移 量 和 字 节 偏 移 位 ， 说 明 每 个 字段 需要 多 少 位 。 

(b) 高 速 缓存 中 的 所 有 标志 占 多 少 位 ? 

(c) 假设 每 个 高 速 缓存 块 还 有 1 位 有 效 位 (V) 和 1 位 脏 位 (D)。 每 一 个 高 速 缓存 组 (包括 
数据 、 标 志和 状态 位 ) 需 要 有 多 少 位 ? 

(d) 使 用 图 8-78 中 的 模块 和 少量 的 2 输入 逻辑 门 设计 高 速 缓存 。 高 速 缓存 的 设计 必须 
包括 标志 存储 、 数 据 存 储 、 地 址 比较 、 数 据 输出 选择 和 任何 你 认为 需要 的 部 件 。 注 
意 复 用 器 和 比较 器 块 可 以 为 任何 大 小 (分 别 为 n 或 者 p 位 宽 )， 但 是 SRAM 块 必须 为 
16K x4 位 。 请 给 出 包含 简明 标志 的 电路 模块 图 。 只 需要 设计 实现 读 功能 的 高 速 


缓存 。 
p p 
14, | 16Kx4 8 x 
SRAM ý 
4 


图 8-78 电路 模块 


你 参加 了 一 个 热门 的 新 因特网 创业 ， 用 内 栓 传 呼 机 和 网 络 浏 览 器 开发 胸 表 。 它 使 用 的 馈 
大 式 处 理 咒 中 采用 了 图 8-79 中 的 多 级 高 速 缓存 方案 。 处 理 器 包括 一 个 小 型 的 片上 高 速 
缓存 和 一 个 大 型 的 片 外 第 二 级 高 速 缓存 (对 ， 这 个 手表 重 3 磅 ,但 是 你 可 以 用 它 上 网 )。 





图 8-79 计算 机 系统 


假设 处 理 器 使 用 32 位 物理 存储 器 地 址 但 只 以 字 边 界 访问 数据 。 表 8-14 给 出 了 高 速 缓存 
参数 。DRAM 的 访问 时 间 为 i, ， 大 小 为 512MB。 
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8.15 


8. 16 


8.17 


表 8-14 ”存储 器 特性 





特性 片上 高 速 缓 存 片 外 高 速 缓存 
组 织 方式 4 路 组 相 联 直接 映射 
命中 率 A B 

访问 时 间 ta fy 

块 大 小 16 字 节 16 字 节 

块 数 目 512 256K 


(a) 对 于 存储 器 中 的 给 定 的 字 , 在 片上 高 速 缓存 和 第 三 级 高 速 缓存 中 总 共有 多 少 个 可 能 
的 位 置 可 以 找到 它 ? 

(b) 片上 高 速 缓存 和 第 二 级 高 速 缓 存 的 每 个 标志 各 需要 多 少 位 ? 

(c) 给 出 内 存 平均 访问 时 间 的 表达 式 。 两 级 高 速 缓存 按 顺序 连续 访问 。 

(d) 对 于 某 一 特定 问题 ,测量 说 明 片 上 高 速 缓存 的 命中 率 为 85%， 第 二 级 高 速 缓存 的 
命中 率 为 90% 。 然 而 ， 当 屏蔽 片上 高 速 缓存 时 ， 第 二 级 高 速 缓 存 的 命中 率 提高 到 
98. 5% 。 请 解释 这 个 现象 。 

本 章 描述 了 多 路 相 联 高 速 缓存 的 最 近 最 少 使 用 (LRU ) 替换 策略 。 还 有 一 些 不 太 常 见 的 

策略 ， 如 先入 先 出 (FIFO) 策 略 和 随机 策略 。FIFO 策略 替换 出 存在 最 长 时 间 的 块 ， 而 不 

考虑 它 是 否 最 近 被 访问 过 。 随 机 策略 则 随机 选择 一 个 块 进行 替换 。 

(a) 讨论 这 些 蔡 换 策 略 的 优 缺 点 

(b) 描述 一 个 FIFO 比 LRU 性 能 更 好 的 数据 访问 模式 

你 正在 设计 的 计算 机 存储 体系 结构 为 单独 的 指令 和 数据 高 速 缓存 ， 并 使 用 图 7-41 中 的 

MIPS 多 周期 处 理 器 ， 主 频 为 1GHz。 

(a) 假设 指令 高 速 缓 存 已 经 完美 (总 是 命中 )， 但 数据 高 速 缓 存 有 5% 的 缺失 率 。 在 高 速 
缓存 缺失 时 ， 处 理 器 暂停 60ns 访问 主 存 ， 之 后 恢复 正常 操作 。 考 虑 高 速 缓存 缺失 
的 情况 ， 平均 内 存 访问 时 间 为 多 少 ? 

(b) 考虑 到 非 理 想 的 存储 器 系统 ， 平 均 每 一 条 装 人 和 存储 指令 需要 多 少 个 时 钟 周 期 ? 

(c) 考虑 例 7.7 中 的 基准 测试 程序 ， 其 中 有 25% 的 装 人 指令 ，10% 的 存储 指令 ，119% 的 
分 支 指令 ，2% 的 跳 转 指令 和 52% 的 R 类 型 指令 。 考 虑 非 理想 的 存储 器 系统 ， 这 
个 基准 测试 程序 的 平均 CPI 是 多 少 ? 

(d) 现在 假设 指令 高 速 缓存 也 是 非 理想 的 ， 缺 失 率 为 7% ， 那么 (c) 部 分 的 基准 测试 程 
序 的 平均 CPI 是 多 少 ? 把 指令 和 数据 高 速 缓存 缺失 都 考虑 在 内 。 

使 用 以 下 参数 重 做 习题 8. 16。 

(a) 假设 指令 高 速 缓存 已 经 完美 ( 总 是 命中 )， 但 数据 高 速 缓存 有 15% 的 缺失 率 。 在 高 
速 缓存 缺失 时 ， 处 理 器 暂停 200ns 访问 主 存 ， 之 后 恢复 正常 操作 。 考 虑 高 速 缓存 缺 
失 的 情况 ,平均 内 存 访问 时 间 为 多 少 ? 

(b) 考虑 非 理 想 的 存储 器 系统 ,平均 每 二 条 装 人 和 存储 指令 需要 多 少 个 时 钟 周 期 ? 

(ce) 考虑 例 7.7 中 的 基准 测试 程序 ， 其 中 有 25% 的 装 入 指令 ，10% 的 存储 指令 ，11% 的 
分 支 指令 ，2% 的 跳 转 指令 和 5$2% 的 R 类 型 指令 。 考 虑 非 理 想 的 存储 器 系统 ， 这 个 
基准 测试 程序 的 平均 CP 是 多 少 ? 

(d) 现在 假设 指令 高 速 缓存 也 是 非 理 想 的 ， 缺 失 率 为 10% ， 那 么 (ec) 部 分 的 基准 测试 程 
序 的 平均 CPI 是 多 少 ? 把 指令 和 数据 高 速 缓存 缺失 都 考虑 在 内 。 
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8. 18 


8. 19 


8. 20 


8. 21 


8. 22 


如 果 计 算 机 使 用 64 位 虚 地 址 ; 那么 可 以 访问 多 少 个 虚拟 存储 器 。 注 意 2 字 节 = 1 兆 兆 

字 节 (TB) ，2 字 节 =1 拍 字 节 (PB) 2° =1 tF (EB). 

一 个 超级 计算 机 的 设计 者 花费 100 百 万 美元 在 DRAM 上 ， 同 时 花费 同样 多 的 钱 在 硬盘 

上 作为 虚拟 存储 器 。 根 据 图 8-4 的 价格 ， 这 人 台 计 算 机 可 以 拥有 多 大 的 物理 存储 器 和 虚拟 

存储 器 。 需 要 多 少 位 的 物理 地 址 和 虚 地 址 来 访问 这 个 存储 器 系统 ? 

考虑 一 个 可 以 寻 址 全 部 2 字 节 的 虚拟 存储 器 系统 。 你 有 无 限 的 硬盘 空间 ， 但 是 只 有 有 

限 的 8MB 物理 存储 器 。 假 设 虚 页 和 物理 页 都 是 4KB。 

(a) 物理 地 址 为 多 少 位 ? 

(b) 系统 中 最 大 的 虚 页 号 是 多 少 ? 

(c) 系统 中 有 多 少 物 理 页 ? 

(d) 虚 页 号 和 物理 页 号 占 多 少 位 ? 

(e) 假设 你 设计 了 一 个 把 虚拟 存储 器 映射 到 物理 存储 器 上 的 直接 映射 方案 。 该 映射 使 用 
虚 页 号 的 多 位 最 低 有 效 位 来 确定 物理 页 号 。 每 一 个 物理 页 上 可 以 映射 多 少 虚 页 ? 为 
什么 这 里 的 直接 映射 不 是 一 个 好 的 方案 ? 

(f) 显然 地 ， 需 要 一 个 比 (d) 部 分 更 有 灵活 性 和 动态 性 的 虚拟 存储 器 地 址 到 物理 地 址 的 
转换 方案 。 假 设 你 使 用 一 个 页 表 存 储 上 映射 (从 虚 页 号 到 物理 页 号 的 转换 )。 页 表 将 
包含 多 少 个 页 表 表 项 ? 

(g) 除了 物理 页 号 外 ， 每 个 页 表 表 项 还 要 包括 一 些 状态 信息 ， 如 有 效 位 (V) 和 脏 位 
(DD)。 每 一 个 页 表 表 项 需要 占用 多 少 字 节 ? (整数 字 节 向 上 取 整 ) 

(h) 给 出 页 表 的 布局 图 。 页 表 的 大 小 是 多 少 字 节 ? 

考虑 一 个 可 以 寻 址 全 部 2” 字 节 的 虚拟 存储 器 系统 。 你 有 无 限 的 硬盘 空间 ,但 是 只 有 有 

限 的 2GB 物理 存储 器 s。 假设 虚 页 和 物理 页 都 是 4KB。 

(a) 物理 地 址 为 多 少 位 ? 

(b) 系统 中 最 大 的 虚 页 号 是 多 少 ? 

(c) 系统 中 有 多 少 物理 页 ? 

(d) 虚 页 号 和 物理 页 号 占 多 少 位 ? 

(e) 页 表 将 包含 多 少 个 页 表 表 项 ? 

(f) 除了 物理 页 号 外 ， 每 个 页 表 表 项 还 要 包括 一 些 状态 信息 ,如 有 效 位 (WV) 和 脏 位 (DD)。 
每 一 个 页 表 表 项 需要 占用 多 少 字 节 ? (整数 字 节 向 上 取 整 ) 

(g) 给 出 页 表 的 布局 图 。 页 表 的 大 小 是 多 少 字 节 ? 

你 决定 使 用 地 址 转换 后 备 缓冲 器 (TLB ) 为 习题 8. 20 的 虚拟 存储 器 系统 加 速 。 假 设 内 存 

系统 的 参数 如 表 8-15 所 示 。TLB 和 高 速 缓存 的 缺失 率 表示 所 请 求 的 内 容 未 找到 的 概率 。 

主 存 缺失 率 表示 页 面 缺 失 的 概率 。 


表 8-15 存储 器 特性 


存储 器 单元 | 访问 时 间 ( 周 期 ) 缺失 率 
TLB 1 0. 05% 
高 速 缓存 1 2% 

主 存 100 0. 0003 % 
硬盘 1 000 000 0% 


(a) 在 增加 TLB 前 ， 虚 拟 存 储 器 系统 的 平均 内 存 访问 时 间 是 多 少 ? BR Re A E EW 
理 存储 器 中 ， 而 不 会 保存 在 数据 高 速 缓存 中 。 
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8. 26 


8.27 


8. 28 
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(b) WR TLB A 64 个 表 项 ，TLB 大 小 为 多 少 位 ?每 个 表 项 包括 以 下 字段 : 数据 (物理 页 
号 ) 、 标 志 ( 虚 页 号 ) 和 有 效 位 。 给 出 各 个 字段 所 占用 的 位 数 。 

(c) 画 出 TLB 的 草图 ， 清 楚 标 志 所 有 字段 和 尺寸 。 

(d) 需要 多 大 容量 的 SRAM 来 构 (c) 部 分 描述 的 TLB? 以 深度 x 宽度 的 形式 给 出 答案 。 

你 决定 采用 128 个 表 项 的 地 址 转换 后 备 缓 冲 器 (TLB) 加 速 习 题 8. 21 中 的 虚拟 存储 系统 。 

(a) TLB 大 小 为 多 少 位 ?每 个 表 项 中 包括 以 下 字段 : 数据 (物理 页 号 )、 标 志 ( 虚 页 号 ) 
和 有 效 位 。 给 出 各 个 字段 所 占用 的 位 数 。 

(b) it} TLE 的 草图 ， 清 楚 标 志 所 有 字段 和 尺寸 。 

(c) 需要 多 大 容量 的 SRAM 来 构 (b) 部 分 描述 的 TLB? 以 深度 x 宽度 的 形式 给 出 答案 。 

假设 7.4 节 描 述 的 MIPS 多 周期 处 理 器 使 用 虚拟 存储 器 系统 。 

(a) 在 多 周期 处 理 器 原理 图 内 画 出 TLB 的 位 置 。 

(b) 描述 增加 TLB 后 如 何 影 响 处 理 器 的 性 能 。 

你 正在 设计 的 虚拟 存储 器 系统 使 用 一 个 由 专用 硬件 (SRAM 和 相关 逻辑 ) 构成 的 单 级 页 

表 。 它 支持 25 位 虚 地 址 ，22 位 物理 地 址 和 2 “ 字 节 (64KB) 的 页 每 个 页 表 表 项 包含 一 

个 物理 页 号 、 可 用 位 (V) 和 脏 位 (DD)。 

(a) 页 表 的 总 大 小 为 多 少 位 ? 

(b) 操作 系统 小 组 建议 将 页 大 小 从 64KB 减少 到 16KB。 但 是 你 们 小 组 的 硬件 工程 师 坚 
决 反对 ， 认 为 这 将 增加 硬件 开销 。 说 出 他 们 的 理由 。 

(c) 将 页 表 与 片上 高 速 缓 存 集成 在 人 处理 如 芯片 上 。 片 上 高 速 缓存 只 对 物理 地 址 (不 对 虚 
拟 地 址 ) 操 作 。 对 于 给 定 的 内 存 访问 ， 可 以 同时 访问 片上 高 速 缓 存 的 合适 组 和 页 表 
吗 ? 简要 解释 同时 访问 高 速 缓存 组 和 页 表 表 项 的 必要 条 件 。 

(d) 对 于 给 定 的 内 存 访问 ， 可 以 同时 执行 片上 高 速 缓存 的 标志 比较 和 访问 页 表 吗 ?简要 
解释 原因 。 

描述 虚拟 存储 器 系统 可 能 影响 应 用 写 和 的 方案 ;必须 讨论 页 大 小 和 物理 存储 器 大 小 如 

何 影 响 程序 的 性 能 。 

假设 你 的 个 人 计算 机 使 用 32 位 虚 地 址 。 

(a) 每 一 个 程序 可 以 使 用 的 最 大 虚拟 存储 器 空间 是 多 少 ? 

(b) PC 硬盘 的 大 小 如 何 影响 性 能 ? 

(c) PC 的 物理 存储 器 大 小 如 何 影响 性 能 ? 

使 用 MIPS 内 存 映射 VO 与 用 户 交 互 。 每 次 用 户 按 下 按钮 ， 选 择 的 模式 就 在 5 个 发 光 二 

极 管 (LED) 上 显示 。 假设 输入 按钮 映射 到 地 址 OxFFFFFFIO, LED 映射 到 地 址 

0xFFFFFF4。 当 按钮 按 下 时 ， 输 出 为 1， 否 则 为 0。 

(a) 写 出 实现 这 个 功能 的 MIPS 代码 。 

(b) 为 这 个 内 存 映 射 VO 系统 画 出 与 图 8-30 相似 的 原理 图 。 

(c) Sih HDL (US LA ARRAY 1/O 系统 的 地 址 译 公 器 。 

第 3 章 设 计 的 有 限 状 态 机 (FSM) ， 也 可 以 用 软件 实现 。 

(a) 使 用 MIPS 汇编 语言 实现 图 3-25 的 交通 灯 有 限 状态 机 。 输 入 (7T, 和 7 ) 内 存 映 射 到 
地 址 0xFFFFF000 的 第 1 位 和 第 0 位 。 两 个 3 位 输出 (到 和 局 ) 分 别 映射 到 地 址 
OxFFFFFO04 的 第 0 ~ 2 位 和 第 3 ~5 位 。 假 设 每 个 灯 的 输出 上 和 局 采用 独 热 编 码 : 
47100, #010, 4001. 

(b) 为 这 个 内 存 映射 WO 系统 画 出 与 图 8-30 相似 的 原理 图 。. 

(c) 写 出 HDL 代码 实现 内 存 映 射 170 系统 的 地 址 译 码 器 。 
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8.30 针对 图 3-30a 中 的 FSM， 重 复习 题 8. 29。 地 址 0xFFFFF040 的 输入 4 和 输出 了 分 别 由 内 
存 映 射 为 0 和 1。 


面试 问题 

下 述 问 题 在 数字 设计 工作 的 面试 中 曾经 被 问 到 。 

8. 1 解释 直接 映射 、 组 相 联 和 全 相 联 高 速 缓存 的 不 同 。 对 于 每 一 种 高 速 缓存 类 型 ， 给 出 一 个 
程序 ， 其 性 能 要 好 于 其 他 两 种 高 速 缓存 。 

8.2 解释 虚拟 存储 器 系统 是 如 何 工作 的 。 

8.3 解释 使 用 虚拟 存储 器 系统 的 优点 和 缺点 。 

8.4 解释 存储 器 系统 的 虚 页 大 小 如 何 影响 高 速 缓存 的 性 能 。 

8.5 用 于 内 存 映射 V0 的 地 址 可 以 被 高 速 缓存 吗 ? 解释 为 什么 。 580. 
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A.1 引言 


本 附录 介绍 数字 系统 设计 中 有 关 实 践 方面 的 内 容 。 本 附录 中 的 
材料 对 理解 本 书 的 其 他 内 容 并 非 必 不 可 少 。 但 是 ， 本 附录 内 容 有 助 
于 向 读者 揭示 构造 实际 数字 系统 的 过 程 。 而 且 ， 我 们 认为 理解 数字 
系统 的 最 佳 方法 就 是 在 实验 室 中 目 主 实现 和 调试 实际 系统 。 

数字 系统 通 稼 由 一 片 或 多 片 芯 片 组 成 。 第 一 种 实现 策略 是 将 单 
独 的 逻辑 门 或 较 复杂 的 芯片 (例如 ， 算术 逻辑 单元 、 存 储 右 等 ) 连 接 
在 一 起 。 第 二 种 实现 策略 是 使 用 可 编程 逻辑 必 片 ， 它 包含 的 通用 电 
路 阵列 可 以 实现 特定 的 逻辑 功能 。 第 三 种 实现 策略 是 设计 包含 系统 
所 需 功 能 的 专用 集成 电路 。 这 三 种 策略 在 成 本 、 速 度 、 功 耗 和 设计 
时 间 上 各 有 不 同 ， 下 面 将 简单 介绍 。 此 附录 还 介绍 电路 的 物理 封 
装 、 连 接 必 片 的 传输 线 ， 以 及 数字 系统 的 经 济 性 。 


A.2 74xx 系 列 芯片 


20 世纪 70 年 代 和 80 年 代 ， 许 多 数字 系统 由 简单 的 芯片 构成 ， 
每 个 芯片 包含 少量 逻辑 门 。 例 如 ，7404 芯片 包含 6 个 非 (NOT) 门 ， 
7408 攻 片 包含 4 个 与 (AND ) 门 ，7474 忆 片 包含 两 个 触发 右 。 这 些 
芯片 一 起 称 为 74 xx 系列 逻辑 。 很 多 生产 商 销售 74 x x 系列 芯片 ， 
售 价 约 在 每 片 10 ~ 25 美 分 。 这 些 世 片 现在 已 经 很 少 使 用 了 ， 但 仍 
在 构造 简单 的 数字 系统 或 教学 实验 中 使 用 ， 因 为 它们 比较 便宜 ， 而 
且 易 于 使 用 。74 x x 系列 芯片 主要 采用 14 引 脚 双 列 直 插 封装 (Dual Inline Package, DIP) 。 


A.2.1 逻辑 门 


图 A-1 给 出 了 包含 基本 逻辑 门 的 常见 74 xx 系列 芯片 引 脚 布局 图 。 这 些 芯片 有 时 称 为 小 规 
模 集 成 电路 (Small-Scale Integration, SSI) 芯片 ， 因 为 它们 只 包含 了 很 少 的 晶体 管 。14 引 脚 封装 
通常 在 芯片 上 部 有 一 个 缺口 或 在 左上 角 有 一 个 点 来 表示 芯片 的 方向 。 引 脚 从 左上 角 开 始 编号 为 
第 1 引 脚 ， 并 按照 逆 时 针 方向 递增 。 芯 片 第 14 引 脚 接 电源 (Vs=5V)， 第 7 引 脚 接地 ( GND = 
0V) 。 芯 片 中 的 逻辑 门 数 取 决 于 引 脚 数 。 注 意 ，7421 的 第 3 引 脚 和 第 11 引 脚 为 不 连接 引 脚 
(NC) 。7474 触发 器 使 用 了 D, CLK 和 0 端子 。 它 还 包括 一 个 取 反 的 输出 O。 而 且 ， 该 芯片 还 
将 接收 异步 (或 预先 ) 设 置 (PRE) 和 复位 ( CLR ) 信号 。 这 些 信号 在 低 电 平 有 效 ， 换 句 话说 ， 在 
PRE =0 时 触发 器 被 设置 ， 在 CLR =0 时 它 被 清除 ， 当 PRE = CLR = 1 时 ， 正 常 操作 。 


A.2.2 其 他 功能 


74 x x 系列 还 包含 其 他 一 些 复杂 的 逻辑 功能 ， 如 图 A-2 和 图 A-3 所 示 。 这 些 必 片 称 为 中 等 
规模 集成 ( Medium-Scale Integration, MSI) 芯片 。 大 部 分 必 片 使 用 更 大 的 封装 来 实现 更 多 的 输入 
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图 A-1 常用 的 74 xx 系列 逻辑 门 


和 输出 。 电 源 和 接地 依然 连接 在 芯片 的 右上 角 和 左下 角 。 这 里 只 提供 了 芯片 的 基本 功能 ， 完 整 
的 描述 请 参见 生产 商 提供 的 数据 手册 。 


A. 3 可 编程 逻辑 

可 编程 逻辑 (programmable logic) 包 含 可 配置 成 执行 特定 逻辑 功能 的 电路 阵列 。 我 们 已 经 介 
绍 了 3 种 可 编程 逻辑 器 件 : 可 编程 只 读 存 储 器 ( Programmable Read Only Memory, EROM). 、 可 编 
程 逻辑 阵列 (Programmable Logic Array，PLA7 和 现场 可 编程 门 阵列 (Field Programmable Gate Ar- 
ray，FPCA) 。 本 节 将 介绍 它们 的 芯片 实现 技术 。 配 置 这 些 芯片 可 以 采用 熔断 片上 熔 丝 的 方法 
来 控制 电路 元 件 的 连接 或 断 开 。 由 于 一 旦 熔 丝 熔断 就 不 可 以 恢复 ， 所 以 这 种 方法 为 一 次 性 可 编 
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1G VDD “两 个 4:1 多 路 选择 器 四 个 2:1 多 路 选择 器 
Sl 2G D; : Di: 数据 
S 选择 S 选择 
1D3 S0 Y: 输出 ¥ 输出 
1D2 2D3 Gb: 使 能 Gb: 使 能 
1D1 2D2 always_comb always_comb 
if (1Gb) 1Y = 0; if (Gb) ly = 0; 
1D0 2D1 aise 1Y = 1D{S]; else 1% = S? 1D[1] =: i1D{0); 
always_comb if (Gb) 2Y = 0; 
1Y 2D0 if (2Gb) 2Y = 0; else 2Y = S ? 2DI1] = 2D[0]; 
else = S]; if (Gb) 3Y = 0; 
GND 2Y n i -a else 3Y = S ? 3D{1] : 3D[0]; 
if (Gb) 4Y = 0; 
else 4Y = S ? 4D{1} : 4D[0]; 
74153 4:1 复 用 器 
ai 4 位 计数 器 
ra B ah CLK: 时 钟 
< Oy: 计数 器 输出 
Ybr: iih w HAE 
p: os a CLRb: ”异步 复位 (161) 
G2: 低 电 平 使 同步 复位 (163) 


LOADb: 从 D 装 入 Q 





0 x x xxx 11111111 

1 1 x xxx 11111111 ENP, ENT: 使 能 mi. 

1 0 1 xxx 11111111 RCO: 行 波 执行 

t Oo 0 000 11111110 

1 O 0 001 11111101 always @(posedge CLK) // 74163 
- 3 0 010 11111011 if (~CLRb) Q <= 4'b0000; 

1 0 0 O11 11110111 else if (-LOADb) Q <= D; 

1 O 0 100 11101111 else if (ENP & ENT) Q <= Q+1; 
i, 0 0 £01, 22071125 

Ly 8 0. 110 10111111 assign RCO = (Q == 4'blill) & ENT; 
10 0 111 01111111 


© 


IEN 


2ENb ? 4'bzzzz : 2A; 
2¥1 


1A3 
1Y0 
GND 


1Y2 
2Al 
1Y3 
2A0 


VDD VDD 人 
一 8 位 三 态 缓冲 器 8 位 使 能 寄存 器 
1A0 42 2EN A 和 2 Q7 CLK: 时 钟 
3:0° 
2Y3 43 1Y0 Y, 输出 3 D7 
ENb: 7:0° 
1Al 44 2A3 使 能 4 D6 Ent: ASAE 
2Y2 45 1Y1 i 1Y = 5 Q6 
IENb ? 4'b2 v LA; gagi 
1A2 d6 DA KA eena ZZZ 6 Q5 Brr iTr CLK) 
7 7 
8 8 
9 9 
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P 
CF 
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74244 三 态 缓冲 器 74377 寄 存 器 
图 A-2 中 等 规模 集成 芯片 


程 (One-Time Programmable，OTP) 。 此 外 ， 也 可 以 将 配置 信息 存储 在 存储 带 中 ， 这 样 就 可 以 多 
次 编程 。 可 编程 逻辑 在 实验 室 中 非常 方便 ， 因 为 同样 的 芯片 可 以 在 开发 过 程 中 多 次 使 用 。 


A. 3.1 PROM 


05.57 节 所 述 ，PROM 可 以 用 于 查找 表 。 一 个 2 字 x M 位 的 PROM 可 以 编程 为 执行 任意 
N 个 输入 和 1 个 输出 的 组 合 逻 辑 功能 。 当 设计 改变 时 ， 仅 仅 需要 修改 PROM 的 内 容 ， 而 不 需 
要 重新 连接 心 片 之 间 连 线 。 查 找 表 对 小 函数 比较 有 效 , 但 是 当 输 入 数 增加 时 其 成 本 将 非常 高 。 

例如 ， 典 型 的 27 648KB(64Kb) 可 擦 写 PROM 芯片 显示 在 图 A-4 中 。 该 EPROM 有 13 个 地 
址 线 用 来 确定 访问 8K 字 和 8 位 数据 线 的 哪 一 个 读 取 此 字 的 字 节 数据 。 在 读数 据 时 ， 忌 片 使 能 
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7 段 数 码 管 显示 译 码 器 RBO LT RBI D3:0 abcde fg 
x x x t t i 半生 
VDD 0 1 
一 Dig 数据 i 0x x oOo000000 
f ia 2 段 x 1 0 00001111111 
‘a suet 1 1 1 00000000001 
g ( 低 电 平 = 开 ) 1 1 1 00011001111 
= LTb: 发 光 测 试 i L 2” 001006100629 
“i RBIb: 行 波 消 隐 输入 1 1 00110000110 
b t. a Torovi Host wo 
RBOb: “ 行 波 消 隐 输出 1 21 1 01010100100 
= i i z aroni LS Be 8 D8 
iad Se: t t E €@r92"0 0 43 4 25 
1 11 20000000000 
d f| , |b 1 11 10010001100 
E i 2? aago dN 10 
e ee 
i 
e| |e to t Æ- tOO A G a te 
7447 7-Segment d 4; £2 S62 7267 0% 
t bik Fi OUP Bet 24 
Decoder 1 11 11110000000 
B3 VDD 4 位 比较 器 
AltBi， A3 A3.9,B3.0: 数据 
rel: 输入 关系 
AcgB,, B2 
relw 输出 关系 
AgtBi,， A2 
always_comb 
AgtB ou Al if (A> B | (A == B & AgtBin)) begin 
AgtBout = 1; AeqBout = 0; AltBout = 0; 
AeqB,, Bl i end 
else if (A< B | (A == B & AltBin) begin 
AltB ou AO AgtBout = 0; AeqBout = 0; AltBout = 1; 
end else begin 
GND BO AgtBout = 0; AeqBout = 1; AltBout = 0; 
end 
7485 Comparator 
always_comb 
BO VDD 
case (F) 
AO 42 Al 4 位 ALU 0000: Y =M ? ~A A + ~Cbn; 
——— 0001: Y =M ? ~(A | B) A PE - + ~Cbn; 
S3 43 Bl As.0,By0: 输入 0010: Y = M ? (~A) & B A + ~B + ~Cbn; 
Rees j 0011: Y =M ? 4'b0000 4'b1111 + ~Cbn; 
S2 44 A2 F. 功能 选择 0100: ¥ =M? ~(A & B) A + (A & ~B) + 4Cbn; 
ie 模式 选择 0101: Y = M ? -B (‘A | BY + (A G ~B) + ~Cbn; 
$1 45 B2 M: 0110: Y =M FA^B A x - Cbn; 
so 6 A3 Cb,: 进位 输入 0111: Y=M?A&-B (A & ~B) - Cbn; 
Cb : “进位 输出 1000: Y =M ? ~A +B A + (A & B) + ~Cbn; 
C 7 B3 B. 相等 1001: Y =M ? ~(A ^ B) A + É + ~Cbn; 
n AegB : 1010: Y=M?B (A | ~B) + (A & B) + ~Cbn; 
M -8 y (采用 某 种 模式 ) 1011: Y=M? A&B (A & B) + ~Cbn; 
nae X.Y: 行进 人 A y DEO VjM 21 A + A + ~Cbn; 
FO 9 Caa ? ii 加 法 器 1101: Y =H TA | -B (A | B) + A + ~Cbn; 
* 4 1110: Y=M?A | ni =e. B + ~Cbn; 
Fl 410 xX lili: Y=M?A A + -Cbn; 
11 endcase 
F2 A=B 
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© 
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74181 ALU 
图 A-3 ”中 等 规模 集成 芯片 


和 读 出 使 能 必须 都 有 效 。 最 大 传播 延迟 为 200ps。 在 正常 操作 下 ，PGM =1 且 不 使 用 VPP. 
EPROM 通常 由 专业 编程 人 员 编程 ， 设 置 PCM =0，VPP =13V， 并 通过 特殊 的 输入 序列 来 配置 
存储 器 。 

现代 PROM 在 概念 上 与 之 类 似 , 但 是 容量 更 大 ， 而 且 引 脚 更 多 。 闪 存 比 PROM 更 便宜 。 
2006 年 ， 每 GB 容量 的 售 价 约 为 30 美元 ， 而且 其 价格 平均 每 年 下 降 30% ~40% 。 


A.3.2 PLA 


如 5.6.1 节 所 述 ，PLA 包含 与 门 和 或 门 用 于 实现 任意 积 之 和 形式 的 组 合 逻辑 功能 。 与 门 和 
或 门 都 使 用 PROM 作为 可 编程 方法 。 一 个 PLA 芯片 对 每 个 输入 有 两 列 ， 对 于 每 个 输出 有 一 列 ， 
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对 于 每 个 最 小 项 有 一 行 。 这 种 组 织 方法 在 实现 很 多 函数 时 比 PROM 更 有 效 ， 但 是 对 于 具有 较 多 
IO 和 最 小 项 数 的 函数 ， 阵 列 增长 速度 


10 





也 很 快 。 > 8 KB EPROM 
许多 不 同 的 制造 商 扩展 了 基本 PLA , eT ne 

概念 ， 生 产 了 包含 寄存 器 的 可 编程 逻辑 CEb: ”芯片 使 能 

器 件 ( Programmable Logic Device，PLD ) 。 5 “ion Ea 

22V10 是 一 个 最 流行 的 经 典 PLD 器 件 。 6 

Bas ABR 12 个 专用 输入 引 脚 和 10 个 输 7 

出 引 脚 。 输 出 可 以 直接 从 PLA 引出 ， 也 

可 以 从 芯片 上 的 时 钟 控制 寄存 器 上 引 

Ho 输出 也 可 以 反馈 输入 到 PLA, 

22V10 可 以 直接 实现 最 多 12 个 输入 、10 

个 输出 和 10 位 状态 的 有 限 状 态 机 。 

22V10 在 采购 100 片 时 价格 约 为 2 美元 / 

片 。 由 于 FPCA 在 容量 和 成 本 上 的 进 

步 ，PLA 已 经 逐渐 过 时 。 图 A-4 2764 8KB EPROM 


A.3.3 FPGA 


如 5.6.2 WATÈ, FPGA 由 可 配置 逻辑 单元 ( Logic Element, LE) 阵列 ， 或 称 为 可 配置 逻辑 
块 (Configurable Logic Block ，CLB) 组 成 ， 并 通过 可 编程 线 连接 起 来 。 这 些 LE 包含 了 小 的 查找 
表 和 触发 器 。FPGA 规模 可 以 平滑 地 扩展 到 非常 大 的 容量 ， 包 含 数 以 千 计 的 查找 表 。Xilinx 公 
司 和 Altera 公司 是 FPGA 领域 的 两 家 领军 企业 。 

查找 表 和 可 编程 线 提 供 了 足够 的 灵活 性 来 实现 任意 逻辑 功能 。 然 而 ， 它 们 在 必 片 面积 和 速 
度 方面 比 硬 连 线 逻 辑 实现 要 差 一 个 数量 级 。 因 此 ，FPGA 经 常 包 含 专 
用 模块 ， 例 如 存储 器 、 复 用 器 ， 其 至 整个 微 处 理 妖 。 

图 A-5 给 出 了 FPGA 上 数字 系统 的 设计 过 程 。 虽 然 有 些 FPGA T. 
具 也 支持 原理 图 ， 但 设计 通常 使 用 硬件 描述 语言 (HDL) 给 定 。 然 后 设 
计 就 需要 经 过 模拟 。 给 定 输入 并 比较 是 否 与 期 得 的 输出 相同 ， 以 便 验 
证 (verify ) 人 逻辑 是 否 正 确 。 通 常 需要 进行 一 些 调试 。 接 着 ,逻辑 综合 
( synthesis ) 将 硬件 描述 语言 转换 为 布尔 函数 。 好 的 绿 合 工 具 还 可 以 产 
生 函 数 的 原理 图 ， 精 明 的 设计 者 检查 这 些 原理 图 和 综合 阶段 产生 的 警 
告 信息 ， 以 便 确认 是 否 产 生 了 所 希望 的 逻辑 。 有 时 ,一些 马 虎 的 编码 
可 能 导致 产生 的 电路 过 大 ， 或 产生 异步 逻辑 电路 。 当 综合 结果 比较 好 
时 ，FPGA 工具 将 这 些 函 数 映 射 (map) 到 特定 芯片 的 LE 上 。 布 局 和 布 
% ( place and route) 工具 决定 哪个 函数 在 哪个 查找 表 中 实现 ， 并 怎样 将 
它们 连接 起 来 。 导 线 延 时 随 着 长 度 增加 ， 因 此 关键 电路 应 尽 可 能 靠近 
放 在 一 起 。 如 果 设 计 过 大 使 得 蕊 片 容纳 不 下 ， 则 必须 重新 设计 。 时 序 
分 析 ( timing analysis ) 将 和 时 序 约束 (例如 ， 期 望 的 时 钟 主 频 100MHz) 
与 实际 电路 延迟 进行 比较 ， 并 报告 错误 。 如 果 逻 辑 太 慢 ， 则 可 能 必须 
重新 设计 或 使 用 不 同 流水 线 。 当 设计 正确 时 ,产生 一 个 说 明 FPGA 上 
所 有 LE 的 内 容 和 所 有 线路 的 编程 信息 的 文件 。 许 多 FPGA 将 配置 信 
息 存储 在 静态 RAM 上 ， 在 每 次 FFGA 上 电 时 静态 RAM 都 需要 重复 加 “图 A-5 FPGA 设计 流程 
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载 。 在 实验 室 中 ，FPGA 可 以 从 计算 机 上 下 载 这 些 配置 信息 ， 或 者 在 第 一 次 上 电 时 从 非 易 失 
ROM 中 读 取 这 些 信 息 。 

FPGA 时 序 分 析 

Alyssa P. Hacker 正在 使 用 FPGA 实现 一 个 M&M 排序 器 ， 利 用 颜色 传感器 和 电动 机 将 红色 
的 糖果 放 入 一 个 兔子 中 ， 将 绿色 的 糖果 放 和 人 另 一 个 钠 子 中 。 她 的 设计 使 用 了 FSM， 他 正在 使 用 
Cyclone IV GX。 根 据 数据 手册 ，FPGA 的 时 序 特性 如 表 A-1 所 示 。 


表 A-1 Cyclone IV GX 时 序 参 数 







| 
tpoq 199 tog (每 个 LE) 381 
l setup 76 Fie ( LE 之 间 ) 246 


t skew 


Alyssa 希望 她 的 FSM 可 以 运行 在 100MHz。 在 关键 路 径 上 最 多 可 以 有 多 少 个 LE? FSM 最 快 
的 运行 速度 是 多 少 ? 

解 : 在 100MHz 时 ， 周 期 时 间 了 .为 10ns。Alyssa 可 以 用 式 (3-13) 来 计算 这 个 周期 时 间 最 大 
组 合 传播 延迟 hogs 

ta S 10ns — (0. 199ns + 0.076ns) = 9.725ns (A-1) 

由 于 组 合 LE 和 线路 的 延迟 为 381ps +246ps =627ps， 所 以 Alyssa 的 FSM 最 多 可 以 用 15 个 
连续 的 LE(9. 725/0. 627 ) 来 实现 下 一 个 状态 逻辑 。 

当 它 为 下 一 个 状态 逻辑 使 用 一 个 单独 的 IE 时 ，FSM 将 以 最 快速 度 在 Lyclone IV FPGA 上 运 
行 。 最 小 周期 时 间 为 : 

T. > 381ps + 199ps + 76ps = 656ps ( A-2) 
因此 ， 最 大 频率 为 1.5CHz。 < 
Altera 公司 宣传 Cyclone IV FPGA 具有 14400 A LE, 2012 年 的 售 价 为 每 片 25 美元 。 大 批量 

生产 时 ， 中 等 尺寸 的 FPGA 一 般 成 本 为 每 片 几 美元 。 最 大 的 FPGA 成 本 可 达 每 片 几 百 甚 至 几 千 
美元 。FPGA 的 价格 平均 每 年 下 降 30% 左右 ， 因 此 其 使 用 将 更 加 普及 。 


A.4 专用 集成 电路 


专用 集成 电路 ( Application-Specific Integrated Circuit，ASIC ) 是 为 专门 用 途 设 计 的 集成 电路 。 
图 形 加 速 器 、 网 络 接口 芯片 、 无 线 电 话 芯 片 都 是 ASIC 的 常见 例子 。ASIC 设计 师 布局 晶体 管 产 
生 逻 辑 门 ， 并 将 这 些 门 用 线 连 接 起 来 。 由 于 ASIC 是 针对 特定 功能 硬 连 线 的 ， 所 以 它 一 般 比 实 
现 同样 功能 的 FPGA 速度 要 快 好 几 倍 ,芯片 面积 (成 本 ) 也 要 小 一 个 数量 级 。 然 而 ， 确 定 芯片 上 
晶体 管 和 连 线 如 何 布局 的 掩 膜 (mask ) 需 要 花费 上 万 美元 生产 。 工 厂 的 生产 流程 也 需要 6 ~12 个 
月 来 完成 制造 、 封 装 和 测试 ASIC 芯片 。 如 果 在 ASIC 生产 出 来 后 发 现 错误 ， 设 计 者 必须 改正 问 
题 ， 重 新 产生 掩 膜 ， 并 等 待 下 一 批 芯片 生产 出 来 。 因 此 ，ASIC 只 适合 于 大 量 生 产 的 芯片 ， 而 
且 其 功能 也 需要 预先 准确 定义 。 

图 A-6 给 出 的 ASIC 设计 流程 类 似 于 图 A-5 中 的 FPGA 设计 流程 。 逻 辑 验证 尤其 重要 ， 因 
为 一 旦 在 掩 膜 生 产 出 来 后 才 发 现 错误 ， 其 修改 成 本 非常 高 。 综 合 产 生 的 网 表 ( netlist) 包 括 人 逻辑 
门 和 逻辑 门 之 间 连 接 ; 对 网 表 中 的 逻辑 门 进行 布局 ， 对 门 之 间 的 连 线 进行 布线 。 当 设计 满足 要 
求 时 ， 生 产 掩 膜 并 将 它们 用 于 制造 ASIC。 一 个 灰尘 的 污点 就 可 能 毁坏 一 个 ASIC 世族 ， 因 此 心 
片 在 生产 后 必须 测试 。 生 产 出 来 后 能 正常 工作 芯片 的 比例 称 为 良品 率 (yield) 。 良 品 率 一 般 在 
50% ~90% 左 右 ， 这 依赖 于 芯片 大 小 和 制造 工艺 的 成 熟 度 。 最 后 ， 能 正常 工作 的 芯片 将 放 在 
A.7 市 讨论 的 封装 中 。 


A 


A.5 数据 手册 


集成 电路 生产 商都 提供 描述 其 芯片 功能 和 性 能 的 数据 手册 (data sheet) 。 阅 读 和 理解 必 片 手 
册 是 非常 必要 的 。 导 致 数字 电路 系统 错误 的 一 个 重要 原因 就 是 没有 oe 
正确 理解 芯片 的 操作 。 


jA 
数据 手册 通常 可 以 从 制造 商 的 网 站 上 获得 。 如果 你 无 法 找到 一 个 
部 件 的 数据 手册 ,并且 没有 从 其 他 来 源 得 到 的 清晰 文档 ， 就 不 要 使 用 are 


该 部 件 。 数 据 手册 中 的 有 些 项 被 隐藏 了 。 制 造 商 提供 的 芯片 手册 往往 
包含 了 多 个 相关 部 分 的 数据 手册 。 芯 片 手册 的 开始 部 分 一 般 都 是 介绍 
信息 。 通 过 仔细 地 查找 ， 这 些 信息 一 般 都 可 以 在 因特网 上 找到 。 


本 节 将 讨论 德州 仪器 公司 (Texas Instruments, TI) 的 非 门 芯片 = 
74HC04 的 数据 手册 。 这 个 数据 手册 相对 简单 但 是 说 明了 很 多 关键 性 
fa, TT 公司 还 生产 74 x x 系列 的 很 多 其 他 芯片 。 过 去 ， 有 很 多 公 a 

司 生 产 这 类 芯片 ， 但 是 由 于 销售 减少 ， 所 以 市 场 已 经 开始 萎缩 。 

图 A-7 给 出 了 数据 手册 的 第 1 页 。 某 些 关 键 部 分 用 灰色 背景 突 E 
出 显示 。 标 题 是 SN54HC04, SN74HC04 HEX INVERTERS, HEX IN- 
VERTERS 表示 芯片 包含 了 6 个 非 门 。SN 为 TI 的 制造 商标 号 。 其 他 太 慢 
的 制造 商 也 有 类 似 的 编号 ， 例 如 Motorola 的 标号 为 MC, National 
Semiconductor 的 标号 为 DM。 这 些 标号 可 以 忽略 ， 因 为 所 有 制造 商 提 
供 的 74 x x 系列 逻辑 是 相互 兼容 的 。HC 是 逻辑 族 (高 速 CMOS), BB 
辑 族 决定 芯片 的 速度 和 功 耗 ， 而 不 是 功能 。 例 如 7404、74HC04 和 
74LS04 芯片 都 包含 6 个 非 门 ， 但 性 能 和 成 本 却 不 相同 。 其 他 的 逻辑 
族 将 在 A.6 节 中 介绍 。74 x x 系列 芯片 的 操作 温度 为 在 商业 范围 
((0 ~70°C ) 或 工业 范围 ( -40 ~ 85°C), 54 x x 系列 芯片 则 为 军用 范 => 
围 ( -55 ~ 125%C ) ， 其 售 价 更 高 但 也 具有 相同 的 功能 。 aan | 

7404 有 多 种 不 同 的 封装 ， 在 购买 之 前 需要 认真 选择 。 封 装 由 型 
号 数字 后 面 的 一 个 字母 表示 。N 表示 塑料 双 列 直 插 (Plastic Dual Lin- 
line Package，PDIP) ， 它 可 以 直接 插 在 电路 实验 板 中 或 者 可 以 固定 在 “图 A.6 ASIC 设计 流程 图 
印刷 电路 板 的 通 孔 中 。 其 他 的 封装 将 在 A.7 节 中 讨论 。 

功能 表 表 示 每 个 门将 其 输入 取 反 。 如 果 4 为 高 (H) ， 则 了 为 低 (L)， 反 之 亦 然 。 这 个 表 在 
本 例子 中 显得 很 不 重要 ， 但 是 在 复杂 的 芯片 中 却 非常 有 意义 。 

图 A-8 给 出 了 数据 手册 的 第 2 页 。 逻 辑 电路 图 表示 芯片 包含 了 非 门 。 如 果 工 作 条 件 超过 了 
绝对 最 大 (absolute maximum ) 部 分 描述 的 条 件 ， 芯 片 将 毁坏 。 尤 其 是 ， 电 源 电 压 ( Ye， 此 手册 
中 也 称 为 Voo) 不 能 超过 7V， 连 续 输出 电流 不 超过 25mA。 温 阻 (thermal resistance) 或 温 阻 抗 9,， 
用 于 计算 芯片 在 特定 功 耗 情况 下 温度 的 上 升 情况 。 如 果 芯 片 周围 的 环境 温度 为 7, 且 芯片 的 当 
前 功 耗 为 P。， 则 芯片 封装 结 点 (conjunction ) 的 温度 为 

Tr, = 7T, + P sin On (A-3) 

例如 ， 如 果 用 塑料 DIP 封装 的 7404 芯片 工作 在 50°C 的 热 盒子 中 且 功 耗 为 20mW， 则 结 温 
上 升 到 50C +0.02W x80T/W =51.6% 。 对 于 74 x x 系列 芯片 ， 内 部 功 耗 问题 并 不 重要 ,但 
是 对 于 现代 功 耗 超过 10W 以 上 的 芯片 却 非常 重要 。 

推荐 的 操作 条 件 定义 了 芯片 使 用 的 正确 环境 。 在 此 工作 条 件 下 ， 芯 片 将 满足 规范 要 求 。 这 
些 条 件 比 绝对 最 大 条 件 更 为 严格 。 例 如 ， 电 源 电压 应 为 2 ~6V。 对 于 HC 逻辑 族 ， 输 入 逻辑 电 
SERB Voo M Vo =5V 时 ， 使 用 4. SV 输入 允许 系统 中 噪声 产生 10% 的 电源 电压 降 。 
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SNS4HCO4, SN74HCO4 
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èe Wide Operating Voltage Range of 2 V to 6V @ Typical tpd = 8ns 


@ Outputs Can Drive Up To 10 LSTTL Loads @ +4-mA Output Drive at 5V 
@ Low Power Consumption, 20-A Max Ice @ Low Input Current of 1A Max 
SN54HC04 ... JOR W PACKAGE 
SN74HC04 ... D, N, NS, OR PW PACKAGE SN54HC04 ... FK PACKAGE 
(TOPVIEW) (TOPVIEW) 





description/ordering information 


‘The "HC04 devices contain eos yp eas ye Ay ashton 
in positive logic. _ | 


ORDERING INFORMATION 
ORDERABLE TOP-SIDE 
re 
PDPN 
HCO4 
pe ee) a 
TSSOP-PW HCO4 
-55°C to 125°C 


+Package drawings, standard packing quantities, thermal data, symbolization, and PCB design guidelines are 
available at www.ti.com/sc/package. , aa 
















A Please be aware that an important notice concerning availability, standard warranty, and use in critical applications 
of Texas Instruments semiconductor products and disclaimers there to appears at the end of this data sheet. 





Products conform to specifications per the terms of Texas Instruments On products compliant to MIL-PRF-38535, all parameters are tested 
standard warranty. Production processing does not necessarily include unless otherwise noted. On all other products, production 


testing of all parameters. INSTRUM ENTS processing does not necessarily include testing of all parameters. 


POST OFFICE BOX655303 *DALLAS,TEXAS75265 


PRODUCTION DATA information is current as of publication date. y j Copyright (c) 2003,TexasInstrumentsincorporated 


图 A-7 7404 数据 手册 的 第 1 页 


A-9 给 出 了 数据 手册 的 第 3 页 。 电 气 特性 描述 如 果 输 入 恒定 ， 当 推荐 的 操作 条 件 时 右 件 
的 操作 。 例 如 ， 如 果 Ve =5V( 也 可 降 为 4.5V), Æ Ion =4.4V W Io =0.1V 时 , 输出 电流 
1oaX1o 均 不 超过 20kA。 如 果 输 出 电流 增加 ， 芯 片上 的 晶体 管 将 尽力 产生 电流 ， 使 得 输出 电压 
不 处 于 理想 工作 状态 。HC 逻辑 族 使 用 产生 非常 小 的 电流 的 CMOS 晶体 管 。 每 个 输入 的 电流 将 
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SN54HC04, SN74HC04 
HEX INVERTERS 


SCLS078D—DECEMBER 1982—REVISED JULY 2003 


“一 一 地 一 一 


absolute maximum ratings over operating free-air temperature range (unless otherwise noted)+ 


logic diagram (positive logic) 


ly volhe iga snd A as -0.5V to 7V 
I CU A Or VY A De Te re +20mA 
Output clamp current AV <0 or V> oo) (SCO Note 1) sad ed edna + 20mA 
Contimiouis output Corel LIV -a0 to V o) pss reeb tment nt efis aeaa iasa +25mA 
Me eT E A A EAR, AAOS E t 50mA 
Package thermal impedance,0, (see Note 2): D package....,..........-s-ica-rassiscrcssreseseccrscesenstassrescesennaeeennaccveseeorentans 86°C/W 
让 80°C/W 

NA DR re SR EN {RR phe pr 76°C/W 
ee baaa aks aii 131°C/W 

Storage temperature range, Trt -65°C to 150°C 


十 Stresses beyond those listed under “absolute maximum ratings” may cause permanent damage to the device. These are stress ratings 
only, and functional operation of the device at these or any other conditions beyond those indicated under “recommended operating 
conditions” is not implied. Exposure to absolute-maximum-rated conditions for extended periods may affect device reliability. 

NOTES: 1. The input and output voltage ratings may be exceeded if the input and output current ratings are observed. 

2. The package thermal impedance is calculated in accordance with JESD 51-7. 


recommended operating conditions (see Note 3) 


SN74HCO04 
UNIT 


Low-level input voltage 


7, mp 
2 Output voltage 


Input transition rise/fall time 





Operating free-air temperature 


NOTES3: All unused inputs of the device must be held at VCC or GND to ensure proper device operation. Refer to the TI application report, 
Implications of Slow or Floating CMOS Inputs, literature number SCBA004. 





好 TEXAS 


INSTRUMENTS 
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图 A-8 7404 数据 手册 的 第 2 页 


小 于 1000nA， 而 且 在 室温 时 典型 值 仅 为 0. 1nA。 在 芯片 处 于 空闲 状态 时 ， 静 态 ( quiescent) 电源 
电流 (1,,) 不 超过 20pA。 每 个 输入 的 电容 小 于 10pF。 

交流 特性 (switching characteristics ) 定义 了 器 件 在 推荐 的 操作 条 件 内 使 用 如 果 输 入 发 生变 化 
时 的 性 能 。 传 播 延 迟 (propagation delay)t 是 为 了 输入 为 0.5Vi. 到 当 输 出 变 为 0.5Vi 之 间 的 时 间 
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SN54HC04, SN74HC04 
HEX INVERTERS 
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electrical characteristics over recommended operating free-air temperature range (unless 
otherwise noted) 

















Ion=-20hA 





0.002 0. 


+1 


switching characteristics over recommended operating free-air temperature range, CL = 5OpF 
(unless otherwise noted) (see Figure 1) 










(NPUD | (OUTPUT) | < 
| | B= 
Ce mae a 


operating characteristics, T,=25°C 
PARAMETER 





Power dissipation capacitance per inverter No load 
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图 A-9 7404 数据 手册 的 第 3 页 


间隔 。 如 果 ee 表面 上 为 5SV， 芯 片 驱动 电容 不 超过 50pF， 则 传播 延迟 将 不 超过 24ns( 而 通常 更 
快 一 些 ) 。 前 面 提 到 每 个 输入 的 电容 为 10pF， 因 此 在 全 速 工作 的 情况 下 该 芯片 不 能 驱动 超过 5 
个 相同 的 芯片 。 实 际 上 ， 芯 片 连 线 上 的 寄生 电容 也 将 进一步 减少 可 用 负载 。 转 换 时 间 (transi- 
tion time) 也 称 为 上 升 / 下 降 时 间 ， 为 0. 1Ycc ~0.9Vcc 之 间 测 量 的 输出 转换 。 

1. 8 节 中 曾经 介绍 过 芯片 功 耗 分 为 静态 (static) 和 动态 (dynamic ) 两 个 部 分 。HC 电路 的 静态 
功 耗 很 低 。 在 855% 时 ， 最 大 静态 电源 电流 为 20kA。 在 工作 电压 5V 时 ， 其 静态 功 耗 为 0. 1mW。 
动态 功 耗 取 决 于 驱动 电容 和 开关 频率 。7404 中 每 个 非 门 的 内 部 功 耗 电容 为 20pF。 如 采 7404 的 


382 附录 A 


所 有 6 个 非 门 都 工作 在 10MHz， 且 驱动 外 部 负载 为 25pF， 则 由 式 (1-4) 可 以 计算 动态 功 耗 为 
(6) (20pF +25pF) (5°) (10MHz) =33.75mW, 最 大 总 功 耗 为 33. 85mW。 
A.6 逻辑 族 

74 x x 系列 逻辑 芯片 可 以 使 用 不 同 的 技术 制造 。 这 些 技术 称 为 逻辑 族 ( logic family) ， 它 们 
可 以 提供 不 同 的 速度 、 功 耗 和 逻辑 电 平 折 中 。 其 他 芯片 往往 设计 为 兼容 这 些 逻 辑 族 。 最 初 的 世 
片 (如 7404) 由 双 极 型 晶体 管制 造 ， 称 为 晶体 管 -~ da4 E 2 H ( Transistor- Transistor Logic, TTL) 。 


在 74 的 后 面 增加 一 个 或 两 个 字母 来 表示 更 新 的 技术 如 74LS04 、74HC04 或 74AHT04。 表 A-2 汇 
总 了 常见 的 5V 逻辑 族 。 


表 A-2 典型 5V 逻辑 族 规范 
tn Auer 


(D Per unit in quantities of 1000 for the 7408 from Texas Instruments in 2012. 


双 极 型 电路 和 工艺 技术 的 进步 产生 肖 特 基 (Schottky，S) 和 低 功 耗 肖 特 基 (LS) 逻 辑 族 。 它 
们 比 TTL 逻辑 族 更 快 。 首 特 基 族 需 要 更 多 的 功 耗 ， 而 低 功 耗 肖 特 基 的 功 耗 则 较 低 。 高 级 肖 特 基 
( AS) 和 高 级 低 功 耗 肖 特 积 (LAS) 比 S 和 LS 在 速度 和 功 耗 方面 均 有 改进 。 快 速 了 上 逻辑 更 快 ， 功 
FEH AS 低 。 所 有 这 些 逻 辑 族 在 输出 为 LOW 时 的 电流 比 输出 为 HIGH 时 的 大 ， 因 此 为 非 对 称 逻 
HEP. CMRK “TIL” BEEP: Vis =2V, Vy,=0.8V, Voy >2.4V, Vo, <0.5V。 

随 着 20 世纪 80 年 代 ~ 90 年 代 CMOS 电路 成 熟 起 来 ， 因 为 其 低 功 耗 和 输入 电流 特性 它们 成 
为 最 为 主流 的 电路 。 高 速 CMOS( High speed CMOS，HC) 和 高 级 高 速 CMOS( Advanced High 
speed CMOS, AHC) 逻辑 族 的 静态 功 耗 几 乎 为 0。 在 高 电 平 和 低 电 平 输出 时 它们 产生 相同 大 小 
的 电流 。 它 们 符合 “CMOS” 逻辑 电 平 ; V,, =3.15V, Vy =1.35V, Vo, >3.8V, Vo, <0.44V。 
但 是 ， 这 些 逻 辑 电 平 与 TIL 电路 不 兼容 ， 因 为 TIL 的 高 电 平 输出 2.4V 不 是 合法 的 CMOS 高 电 
平 输入 。 这 就 出 现 了 高 速 TTL 兼容 CMOS( High-speed TTL- compatible CMOS, HCT) 和 高 级 高 速 
TTL 兼容 CMOS( Advanced High-speed TTL-compatible CMOS，AHCT) 逻 辑 族 。 这 两 个 逻辑 族 接受 
TTL 输入 逻辑 电 平 并 产生 有 效 的 CMOS 输出 逻辑 电 平 。 它 们 比 纯 CMOS 组 件 慢 一 些 。 所 有 
CMOS 芯片 都 对 静态 电路 产生 的 静电 放电 (ElectroStatic Discharge, ESD) 敏感 。 在 处 理 CMOS 芯 
片 前 ， 应 首先 接触 大 的 金属 以 便 接地 释放 上 自身 的 静电 ， 防 止 击 穿 这 些 CMOS 芯片 。 
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74 x x 系列 逻辑 比较 便宜 。 新 的 逻辑 族 往往 比 老 的 还 要 便宜 。LS 风 辑 族 的 应 用 最 为 广泛 和 
可 靠 ， 在 没有 特殊 性 能 要 求 的 情况 下 它 是 实验 室 和 一 般 爱 好 者 项 目的 首选 。 

SV 标准 的 应 用 在 20 世纪 90 年 代 中 期 逐渐 减少 ， 当 因为 晶体 管 变 得 非常 小 而 不 能 承受 这 
个 电压 。 而 且 ， 更 低 的 电压 可 以 降低 功 耗 。 目 前 ，3.3V、2.5V、1.8V、1.2V， 甚 至 更 低 的 电 
压 得 到 了 广泛 的 应 用 。 过 多 的 电压 标准 使 得 不 同 电源 供电 的 芯片 之 间 的 通信 更 加 困难 。 表 A-3 
列举 了 一 些 低 电压 逻辑 族 。 不 是 所 有 的 74 xx 系列 芯片 都 支持 这 些 逻 辑 族 。 


表 A-3 inertia 
iG ie p a Aae T E or 


Vad ( V) 





ra Par [us fos [ar pos [os] us [os 
成 本 (US $) 0. 17 0. 20 在 写 时 序 中 没有 延迟 和 电容 


(D Delay and capacitance not available at the time of writing, 


所 有 的 低 电 压 逻 辑 族 都 使 用 CMOS MARERE CY SE a, Ee TPE HL HE Voo 
的 范围 很 宽 ， 但 是 在 电压 较 低 时 工作 速度 也 下 降 。 低 电压 CMOS ( Low- Voltage CMOS, LVC) ) 和 
高 级 低 电 压 CMOS( Advanced Low- Voltage CMOS, ALVC) 逻辑 通常 工作 在 3.3V、2.5SV 或 1.8V。 
LVC 可 以 支持 的 最 高 输入 电压 为 5.5V， 因 此 它 可 以 接收 来 自 5VCMOS 或 TIL 电 路 的 输入 。 高 
级 超 低 电压 CMOS( Advanced Ultra-Low- Voltage CMOS，AUC) 经 常 工作 在 2.5V、1.8V 和 1.2V， 
而 且 速 度 特别 快 。ALVC 和 AUC 逻辑 族 支 持 的 最 高 输入 电压 为 3.6V， 因 此 可 以 接收 3.3V 电路 
的 输入 。 

FPGA 经 常 为 内 部 逻辑 ( 称 为 核 ) 和 IO 引 脚 提供 独立 的 电压 供给 。 当 FPGA 不 断 进步 时 ， 
核电 压 已 经 从 5V 逐步 下 降 到 3.3V、2.5V、1.8V 和 1.2V， 以 便 减少 功 耗 和 避免 对 小 晶体 管 的 
损坏 。FPGA 有 可 以 运行 在 许多 不 同 电压 的 可 配置 的 IO， 以 便 可 以 与 系统 中 其 他 部 分 兼容 。 


A.7 封装 和 组 装 

集成 电路 通常 放置 在 塑料 或 陶瓷 的 封装 (package) 内 。' 封 装 的 主要 作用 包括 : 将 芯片 外 围 
很 小 的 金属 IO 引 脚 引出 到 封装 上 较 大 的 引 脚 上 以 便于 芯片 之 间 的 连接 ; 防止 芯片 受到 物理 损 
坏 ; 将 芯片 产生 的 热 扩 散 到 封装 更 大 的 面积 上 以 便于 冷却 。 将 这 些 封装 好 的 芯片 放 到 实验 电路 
板 或 印刷 电路 板 上 并 连接 在 一 起 组 成 系统 。 

1. H% 

图 A-10 给 出 了 不 同 集成 电路 的 封装 。 封 装 通常 可 以 分 为 通 孔 (through-hole) 和 表面 贴 装 
(Surface Mount, SMT) 两 类 。 顾 名 思 义 ， 通 孔 封 装 的 引 脚 可 以 插 到 印刷 电路 板 上 的 通 孔 或 插座 
中 。 双 列 直 插 封装 (Dual Lnline Packages，DIP) 有 两 列 引 脚 ， 每 个 引 脚 的 间距 为 0.1 英寸 。 引 及 
H+ MF] (Pin Grid Arrays，PGA) 通 过 将 引 脚 放置 在 封装 的 下 方 ， 在 一 个 小 封装 中 容纳 更 多 的 
引 脚 。SMT 封装 是 直接 将 芯片 焊接 在 印刷 电路 板 上 而 不 用 通 孔 。SMT 封装 的 引 脚 称 为 导线 
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(lead) 。 薄 型 小 尺寸 封装 (Thin Small Outline Package，TSOP) 有 两 列 排列 紧密 的 导线 (间距 仅 为 
0.02 英寸 ) 。 塑 料 有 引线 芯片 载体 (Plastic Leaded Chip Carriys, PLCC) 在 四 周 有 丁 形 的 导线 ( 间 
HA 0.05 英寸 ) 。 它 们 可 以 直接 固定 在 印刷 电路 板 或 特殊 的 择 座 上 。 方 形 局 平 封装 (Quad Flat 
Pack ，QFP) 采 用 在 四 周 有 大 量 紧 密 排列 的 引 脚 。 球 机 阵列 (Ball Grid Array, BGA) WISE TAR 
了 引 脚 。 取 而 代 之 的 是 它们 在 封装 的 下 面 有 百 计 的 小 焊 球 。 在 焊 装 时 ， 需 要 将 它 与 印刷 电路 板 
上 的 焊 盘 精确 对 准 ， 然 后 加 热 焊 料 ， 焊 料 融 化 后 就 将 芯片 和 底下 的 电路 板 连接 在 一 起 。 


84 引 脚 PLCc 14 引 脚 DIP 44 引 脚 PLCC ele Vb 
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图 A-10 集成 电路 的 封装 


2. 实验 电路 板 

很 容易 使 用 DP 构成 原型 系统 ， 因 为 它们 可 以 放 在 实验 电路 板 上 。 实 验 电路 板 是 一 个 包含 
很 多 行 插座 的 塑料 板 ， 如 图 A-11 所 示 。 每 行 有 5 个 相互 连接 的 插 孔 。 封 装 的 每 个 引 脚 放 在 单 
独行 的 一 个 插 孔 中 。 导 线 可 以 插入 同一 行 的 插 孔 中 从 而 与 芯片 的 引 肢 相连。 实验 电路 板 经 常 在 
板 的 边缘 提供 单独 连接 插 孔 的 列 以 便 放 置 电源 和 接地 。 

图 A-11 显示 了 包含 74LS08 与 门 和 
74LS32 或 门 的 实验 电路 板 。 电 路 的 原理 
图 如 图 A-12 所 示 。 电 路 原理 图 中 的 每 
个 门 都 标识 了 芯片 (08 或 32) 和 其 输入 、 
输出 引 脚 (参见 图 A-1) 。 注 意 ， 在 实验 
电路 板 上 的 相同 连接 。 输 入 连接 到 08 世 
片 的 引 脚 1、2、5， 输 出 连接 到 32 芯片 
的 引 脚 6。 电源 和 接地 分 别 通过 垂直 的 
电源 和 地 线 将 香蕉 形 插头 上 的 Va Al Vb 
连接 到 每 个 芯片 的 引 脚 14 和 7。 原 理 图 
一 般 按 照 这 种 方式 标识 ， 并 在 检查 连接 
时 打上 多， 这 对 减少 构造 实验 电路 板 电 
路 时 的 错误 是 一 种 很 好 的 方法 。 

但 是 ,很 容易 将 导线 插 错 孔 或 有 导 
线 脱 落 ， 因 此 需要 非常 小 心 ( 或 在 实验 
室 中 需要 一 些 调试 ) 来 构造 实验 电路 板 
电路 。 实 验 电路 板 仅仅 适用 于 构造 原型 
系统 ， 而 不 能 大 批量 生产 。 

3. 印刷 电路 板 BR = 

与 实验 电路 板 不 同 ， 世 片 封装 可 以 图 A-11 实验 电路 板 上 的 主要 电路 
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直接 焊接 在 印刷 电路 板 (Printed Circuit Board, PCB) 上 。 印 刷 电路 板 由 很 多 层 导 电 铜 和 绝缘 的 
环 氧 树脂 构成 。 铜 被 刻 刨 成 导线 ， 称 为 进 线 (trace)。 通 孔 (via) 是 在 电路 板 上 钼 的 筷 ， 并 覆 董 
了 金属 从 而 连接 不 同 的 层 。PCB 板 通 常 通 过 计算 机 辅助 设计 (Computer- Aided Design, CAD) T 
具 设 计 。 你 可 以 在 实验 室 里 自己 刻 蚀 或 钻 孔 来 生产 简单 的 电路 板 ， 也 可 以 将 电路 板 设计 送 到 专 
业 厂 家 进行 比较 廉价 的 大 规模 生产 。 工 厂 的 生产 周期 一 般 为 几 天 (或 几 周 ， 针 对 于 廉价 的 大 规 
模 生产 ) ， 需 要 数 百 美元 的 初始 费用 和 少量 的 每 块 板 的 生 CBA 


产 费 用 。 对 于 大 批量 中 等 复杂 的 电路 板 ， 每 块 板 的 生产 费 
用 仅 为 几 美元 。 

印刷 电路 板 的 迹 线 一 般 由 电阻 较 低 的 铜 制 成 。 这 些 迹 
线 被 封装 在 绝缘 材料 中 。 常 见 的 绝缘 材料 是 绿色 的 阻 燃 塑 
料 FR4。 印 刷 电路 板 通 常 在 信号 层 之 间 有 铜 制 的 电源 层 和 接 
地 层 ， 称 为 面 (plane) 。 图 A-13 显示 了 一 个 印刷 电路 板 的 剂 
面 图 。 信 号 层 在 板 的 顶部 和 底部 ， 电 源 和 接地 幅 入 在 板 的 
中 间 。 电 源 和 接地 的 电阻 很 低 ， 可 以 为 板 上 的 组 件 分 配 稳 
定 的 电源 。 它 们 也 使 得 迹 线 的 电容 与 电感 一 致 和 可 预测 。 

图 A-14 给 出 了 20 世纪 70 年 代 最 成 功 的 Apple I + 计算 
机 的 印刷 电路 板 。 照 片上 方 为 Motorola 的 6502 fi Lb FEE, 
下 方 为 6 个 16Kb 的 ROM 芯片 ， 它 们 构成 存储 器 操作 系统 
的 12KB 的 ROM 系统 。3 行 (每 行 8 片 )16Kb 的 DRAM 世 
提供 了 48KB AY RAM。 右 边 是 用 于 存储 器 地 址 译 码 和 其 他 
功能 的 一 些 74 xx 系列 芯片 。 芯 片 之 间 的 连 线 将 各 个 芯片 
连接 起 来 。 一 些 迹 线 末 端的 点 是 覆盖 金属 的 通 孔 。 
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图 A-12 包括 了 必 片 和 引 脚 标识 的 
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图 A-13 ”印刷 电路 板 剂 面 图 
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4. 小 结 

大 多 数 现代 芯片 都 有 大 量 的 输入 和 输出 引 脚 ， 它 们 通常 采用 SMT 封装 ， 尤 其 是 QFP 和 
BGA。 这 些 封装 需要 使 用 印刷 电路 板 ， 而 不 能 使 用 实验 电路 板 。 使 用 BGA 封装 时 更 为 困难 ， 
因为 它们 需要 特殊 的 焊 装 设备 。 而 且 ， 在 实验 室 中 调试 时 ， 这 些 焊 球 因为 隐藏 在 封装 下 面 而 不 
能 通过 电压 表 或 示 波 需 测量 。 | 

总 之 ， 设 计 人 员 需 要 在 早期 考虑 封装 问题 ， 以 便 决 定 在 原型 期 间 是 否 使 用 实验 电路 板 ， 是 
MEH BGA 封装 。 当 专业 的 设计 人 员 确 信 将 忆 片 正确 连接 在 一 起 而 不 需 试 验 时 他 们 很 少 使 用 
实验 电路 板 。 


A.8 传输 线 

我 们 一 直 假 设 线 是 等 电势 的 连接 ， 它 们 在 整个 线 中 的 电压 全 部 相等 。 信 号 在 线 上 实际 上 是 
按 光 速 以 电磁 波 的 方式 传播 的 。 如 果 线 足够 短 或 者 信号 变化 很 慢 ， 则 等 电势 假设 是 正确 的 。 但 
是 当 线 长 度 较 长 或 者 信号 变化 很 快 ， 线 上 的 传输 时 间 对 于 精确 地 确定 电路 延迟 非常 重要 。 我 们 
必须 为 传输 线 ( transmission line) 建立 模型 ， 其 电压 和 电流 的 波 按 光速 传播 。 当 波 传输 到 线 的 终 
扩 时 ， 可 能 会 沿 着 线 产 生 反 射 。 如 果 不 加 以 抑止 ， 这 种 反射 将 产生 噪声 和 奇怪 行为 。 因 此 ， 数 
字 电 路 设计 人 员 必 须 考虑 传输 线 行为 以 便 精 确 计算 长 线 中 的 延迟 和 噪声 影响 。 

电磁 波 在 给 定 介 质 中 按照 光速 传播 ， 虽然 速度 很 快 但 也 不 是 不 需要 时 间 。 光 的 传播 速度 取 


决 于 介质 2 的 介 电 常数 (permittivity )e 和 磁 导 率 ( permeablility)w: v= l 





de fe 
真空 中 的 光速 为 =c =3 x10sm/s。 因 为 FR4 绝缘 层 的 磁 导 率 4 倍 于 真空 ， 所 以 PCB 中 的 信 
号 传输 速度 大 约 为 光速 的 一 半 。 因 此 ，PCB 的 信号 传输 速度 大 约 为 1.5 x 10:m/s( 或 15cm/ns)。 
长 度 为 1 的 传输 线 ， 其 信号 延迟 为 : 
n = 二 
传输 线 的 特性 阻抗 ( characteristic impedance) 2, 为 传输 线 中 电压 和 电流 之 比 : Z = W/o YE 
意 ， 它 不 是 导线 的 电阻 (数字 系统 中 好 的 传输 线 的 电阻 可 以 忽略 不 计 ) 。 忆 依赖 于 传输 线 的 电 
感 和 电容 (参见 A. 8.7 节 的 推导 ) ， 典 型 值 为 50 ~750。 


L 
Zo -J4 (A-5) 


图 A-15 给 出 了 传输 线 符 号 。 这 个 符号 与 有 线 电视 

的 同 轴 电 绕 一 样 ， 内 部 为 信号 传输 线 ， 外 部 为 接地 z j+ 

的 屏蔽 导体 层 。 
理解 传输 线 特性 的 关键 在 于 将 信和 号 传输 想象 为 

电压 波 沿 着 传输 线 以 光速 传播 。 当 波 达 到 终点 时 ， 

根据 终端 负载 它 可 能 会 产生 反射 或 被 吸收 。 反 射 波 

将 沿 着 传输 线 向 后 传播 ， 并 与 线 上 已 有 电压 炙 加 。 图 A-15 ”传输 线 符号 

终端 可 以 分 为 匹配 、 开 路 、 短 路 和 失 配 等 情况 。 下 

面 各 节 将 分 析 波 如 何在 线 上 传输 ， 以 及 传输 到 终端 时 的 情况 。 


A. 8. 1 匹配 终端 
图 A-16 显示 了 带 有 终端 匹配 的 长 度 为 ! 的 传输 线 ， 即 负载 阻抗 Z 等 于 传输 线 的 特性 阻抗 


(A-4) 


加 “一 根 导 线 的 电容 C 和 电感 二 ， 与 导线 所 处 的 物理 介质 的 介 电 常数 和 导 磁 率 有 关 。 
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Z (500) 。 传 输 线 一 端 通过 开关 连接 到 电压 电源 ， 在 上 =0 时 闭合 。 另 一 问 连 接 到 SOD 匹配 负 
载 。 本 节 将 分 析 点 A、B 和 C 的 电压 和 电流 ， 它 们 分 别 位 于 线 的 始 、 线 的 1/3 和 线 的 末端 。 

图 A-17 给 出 了 点 A, B, C 的 电压 随时 间 的 变 
化 。 初 始 时 ， 开 关 未 闭合 ,传输线 中 的 电压 和 电流 
都 为 0。 当 上 =0 时 ， 开 关闭 合 ， 电 源 电 压 上 升 为 了 = 
V,。 这 称 为 人 射 波 由 于 特性 阻抗 为 2,。 ， 所 以 电流 为 
=V/2Zo。 电 压 立即 达到 线 的 起 始点 A 的 电压 ， 如 图 
A-17a 所 示 。 波 沿 着 传输 线 以 光速 传播 。 在 ta/3 时 图 A-16 带 有 终端 匹配 的 传输 线 
到 达 点 B。 此 点 的 电压 从 0 跳 变 到 V, WE A-17b 
所 示 。 在 时 间 t,， 入 射 波 到 达 线 的 终点 C， 电 压 也 随 之 上 升 。 流 经 电阻 Zi 的 电流 所 产生 的 电压 
为 Zil=Z,(V/2Z0) = 了 s， 因为 Zi = Zoo 电压 内 与 波 一 起 沿 着 传输 线 传 播 。 因此 , 波 被 负载 阻 
抗 吸 收 ， 传 输 线 达到 稳定 状态 。 


Z =50Q 
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图 A-17 图 A-16 中 点 4、B、C 的 电压 波形 

在 稳定 状态 ， 传 输 线 的 行为 类 似 于 一 个 理想 的 等 电势 线 ， A, B,C 
因为 线 上 所 有 点 的 电压 都 相同 。 图 A-18 显示 了 图 A-16 中 电 
路 的 稳定 状态 的 等 价 模型 。 线 中 所 有 位 置 的 电压 都 是 V。 V, Z,=50Q 

具有 匹配 源 和 负载 终端 的 传输 线 

图 A-19 中 的 传输 线 具有 匹配 源 阻抗 Zs; 和 人 负载 阻抗 Zo A-18 在 稳定 状态 下 图 A-16 
请 画 出 点 4、B、C 关于 时 间 的 电压 变化 图 。 何 时 系统 达到 稳 的 等 价 电 路 
定 状态 ,稳定 状态 的 的 等 价 电 路 是 什么 ? 






长 度 =/ 
t=l/ Vv 
=50Q 


A-19 具有 匹配 源 和 负载 阻抗 的 传输 线 


解 : 当 电 压 源 有 与 传输 线 串 联 的 源 阻抗 Zs 时 ， 在 Zs 上 将 产生 电压 降 ， 其 余 的 电压 将 沿 传 
输 线 传播 。 首 先 ， 传 输 线 的 行为 像 阻抗 Zu。 因为 线 终端 的 负载 不 可 能 对 传输 线 的 行为 产生 影 
响 直 到 光速 的 延迟 已 经 消逝 。 因 此 ， et 


= “FZ. Z.) = = ( A-6) 


Z.=50Q 


因此 , 在 1 等 于 0 时, BE, lake 沿 传输 线 传播 。 在 时 间 i/3 到 达 点 8， 在 时 间 


HANDAS C, WA A-20 所 示 。 所 有 电流 都 被 负载 阻抗 Z, 吸 收 ， 因 此 电路 在 +=t 时 进入 稳定 状 
态 。 在 稳定 状态 ， 整 个 线 的 电压 均 为 VY,/2， 正 如 图 A-21 所 预测 的 稳定 状态 等 价 电路 。 
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V,/2 V,/2 V; /2 


图 A-20 图 A-19 中 点 4、B、C 的 电压 波形 


A, B,C 


Zs=500 
V; Z,=50Q 


图 A-21 A-19 在 稳定 状态 下 的 等 价 电路 


A. 8.2 开路 终端 


当 负 载 阻抗 不 等 于 Z, 时 ,终端 不 能 吸收 所 有 的 电流 ， 一 部 分 波 必 须 被 反射 。 图 A-22 给 出 了 


一 个 具有 开路 负载 终端 的 传输 线 。 由 于 没有 电流 流 过 开路 终端 ， 所 以 点 C 的 电流 必须 总 是 为 0。 

导线 上 的 电压 最 初 为 0。 在 1=0 时 ， 开 关 
闭合 ， 电 压 波 开始 沿 导线 传播 ， 其 电压 为 /= 
VG) = po TERESA. 中 的 波 
完全 相同 ， 与 终端 无 关 ， 因 为 在 之 前 导线 未 
端的 负载 不 会 影响 导线 开始 处 的 行为 。 该 电压 
波 在 4/3 到 达 点 8， 在 4 到 达 点 Co 








图 A-22 开路 负载 终端 的 传输 线 


当 入 射 波 达到 点 C 时 ， 由 于 导线 是 开路 的 ， 所 以 无 法 向 前 传播 。 它 必须 被 反射 回 源 。 因 为 


开路 终端 反射 所 有 的 波 ， 所 以 反射 波 的 电压 也 是 了 = E, 
V V 


线 上 任意 点 的 电压 等 于 入射 波 和 反射 波 的 和 。 在 :=4 时 ， 点 C 的 电压 为 Y= + Vso Bt 
波 在 时 间 51,/3 到 达 点 8， 在 时 间 24, 到 达 点 4。 当 它 到 达 点 4 时 ， 波 被 与 导线 特性 阻抗 匹配 的 源 终端 


阻抗 吸收 。 因 此 ， 系 统 在 时 间 ,达到 稳定 ， 且 传输 线 成 为 等 电势 线 ， 其 电压 为 V， 电 流 为 0。 


Va Va Ve 
V, /2 V,/2 


t t 
ty 2ta A e E eee | la ta 
a) b) c) 


图 A-23 A-22 中 点 4、B、C 的 电压 波形 


A. 8.3 短路 终端 
图 A-24 给 出 了 男 一 条 传输 线 ， 它 的 终端 与 地 短路 。 因 此 点 C 的 电压 总 是 为 0。 
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与 前 面 的 例子 相同 ， 初 始 时 线 上 的 电压 为 0。 当 开关 闭合 时 ， 电 压 波 (= <2) HE AH 
图 A-25) 。 当 它 到 达 线 的 终端 时 ， 它 必须 向 相 A B c 
反 极 性 反射 。 发 射 波 的 电压 为 Y= 二 、， 并 大 
加 到 入射 波 上 ， 以 便 保证 点 C 的 电压 为 0。 反 
射 波 在 时 间 ;=24 到 达 源 ， 并 被 源 阻抗 吸收 。 
此 时 ， 系 统 达到 稳定 状态 ， 传 输 线 相当 于 等 电 









长 度 =/ 
t=l/v 
Z,=502 


图 A-24 短路 终端 的 传输 线 


势 线 ， 且 电压 为 0。 
Va Ki Vo 
V,/2 V/2 Vs 


t t t 
ly 2ta t,/3 ty St, /3 fs 


a) b) c) 
A-25 图 A-24 中 点 4、B、C 的 电压 波形 


A.8.4 不 匹配 终端 


当 终 端 阻抗 不 等 于 传输 线 的 特性 阻抗 时 ， 称 为 不 匹配 (mismatched)。 一 般 而 言 ， 当 人 射 波 
到 达 不 匹配 终端 时 ， 一 部 分 波 将 被 吸收 ， 一 部 分 波 将 被 发 射 。 反 射 系数 表示 人 入 射 波 中 被 反射 
AEB, BDV =k, Vo 

A. 8. 8 节 利 用 电流 恒定 定律 推导 反射 系数 。 它 说 明 ， 当 入 射 波 沿 着 特性 阻抗 为 Z, 的 传输 线 
到 达 终 端 阻抗 为 2 的 线 的 终端 时 ， 反 射 系 数 为 ; 

Zr - Žo 
e Z, ti 

需要 注意 一 些 特殊 情况 。 如 果 终 端 是 开路 (2+ = 0), Wk, =1, RAAHE A 
此 流出 线 终端 的 电流 保持 为 0) 。 如 果 终 端 是 短路 ( Z+ =0), Wkhe=-1, AAAS ARR 
性 反射 (因此 线 终端 的 电压 保持 为 0)。 如 果 终 端 为 匹配 负载 (Zt =Z), Wk, =0, AAA 
完全 被 吸收 。 

图 A-26 给 出 了 一 个 具有 不 匹配 负载 
终端 的 传输 线 ， 其 中 负载 阻抗 为 73Q。 由 
FZZ <50, BZ, =500; PME k, = 
1/5。 如 前 面 的 例子 所 述 ， 传 输 线 的 初始 
电压 为 0。 当 开关 闭合 后 ， 电 压 波 (V = 
V/2) 沿 传输 线 传播 ， FE t =i 时 到 达 终 图 A-26 ”不 匹配 终端 的 传输 线 
点 。 当 人 射 波 到 达 线 传输 线 末 端的 终端 


V 
Rt, 1/5 的 波 被 反射 ， 剩 下 4/5 的 波 被 负载 阻抗 吸收 。 因 此 ， 反 射 波 的 电压 为 = 未 x 二 = 于 


(A-7) 





点 C 的 总 电压 为 入射 电压 和 反射 电压 的 和 ，V。 = 节 + 让 = -3 在 4=24 时 ， 反 射 波 到 达 点 4， 并 


被 匹配 的 SOD 终端 Zs 吸收 。 图 A-27 显示 了 线 上 的 电压 和 电流 波形 。 注 意 ， 在 稳定 状态 后 (1 > 
21,) ， 传 输 线 等 价 于 等 电势 线 ， 如 图 A-28 所 示 。 在 稳定 状态 ， 系 统 类 似 一 个 分 压 器 ， 因 此 
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Vi = Vs = Ve = Vl( Z, = V,(=—?8 _) = = 


Cara FA EEE 5 


Va 
3V,15 3 及 /5 3V,/5 
V-/2 V./2 


ts t,/3 i 5t,/3 


由 A-27 图 A-26 中 点 4、B、C 的 电压 波形 


反射 可 以 发 生 在 传输 线 的 任意 一 端 。 图 A-29 显 示 了 一 条 传输 线 ， 它 的 源 阻 抗 Z, 为 450Q ， 负 载 
端 为 开路 。 人 负载 上 反射 系数 和 源 的 反射 系数 分别 为 1 和 4/5。 此 时 ， 波 将 在 传输 线 的 两 端 
反射 直至 达到 稳定 状态 。 


ET 
Zs=50Q Zs=4500 ©? ema 
A Z,=75Q A ; 
Z;=509 


图 A-28 在 稳定 状态 下 图 A-26 的 等 价 电路 图 A-29 不 匹配 源 阻抗 和 终端 的 传输 线 

图 A-30 中 的 反射 图 有 助 于 显示 在 传输 线 两 端的 反射 过 程 。 水 

平 轴 代 表 沿 传输 线 的 距离 ， 垂 直 轴 代 表 向 下 递增 的 时 间 。 反 射 图 的 
两 边 代 表 传输 线 的 源 端 (点 4) 和 负载 端 ( 点 C) 。 人 射 和 反射 信号 波 
用 4 和 C tt 在 :=0 时 ， 源 阻抗 和 传输 线 类 似 于 分 


Fear, 产生 一 个 电压 为 六 10 的 波 ， 从 点 4 巾 点 CC 传播 。 在 1=ts 时 ,， 信 





号 到 达 点 C， 且 被 完全 反射 (tu = 1) 。 在 1=26 时 ， 电 压 为 二 的 反射 


波 到 达 点 4， 以 反射 系数 ts =4/5 反射 ， 并 产生 电压 为 2 的 反射 波 


向 点 C 传播 。 以 此 类 推 。 
a dr eid ce eee 





因此 ,在 ;=1.14 时 ， 点 C 的 电压 为 1 + + eo 在 t= =3. Inf, 点 图 A-30 图 A-29 的 反射 图 
Ws 
C 的 电压 为 六 + + +55 +75 =F5， 以 此 类 推 。 图 A-31 给 出 了 电压 和 时 间 的 关系 。 当 4 趋 近 


于 无 穷 大 时 ， 电 压 趋 近 于 稳定 状态 ， 即 内 = Vs =V. =V 





ty Sty Tt 11t,13t, 17t, ! 
"Se oe Se 

a) b) c) 
图 A-31 图 A-29 的 电压 和 电流 波形 
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A.8.5 何 时 使 用 传输 线 模型 


当 传输 线 延 迟 ,大 于 信号 边缘 速率 (信号 上 升 或 下 降 时 间 ) 的 某 个 比例 (例如 20% ) 时 ， 就 
需要 使 用 传输 线 模型 。 如 果 线 延迟 比较 小 ， 它 对 信号 传播 延迟 的 影响 就 非常 微弱 ， 反 里 在 信号 
变化 过 程 中 很 快 消散 。 如 果 线 延迟 比较 大 ， 就 必须 准确 预测 信号 的 传播 延迟 和 波形 。 尤 其 是 ， 
反射 可 能 破坏 波形 的 数字 特性 ， 导 致 错误 逻辑 操作 。 

如 前 所 述 ， 信 和 号 在 印刷 电路 板 上 传输 的 延迟 为 15cm/ns。 对 于 TTL 逻辑 ,边缘 速率 为 
10ns， 只 有 当 线 的 长 度 大 于 30cm 时 (10ns x15cm/ns x 20% ) ， 则 必须 把 线 建 模 为 传输 线 。 印 刷 
电路 板 迹 线 的 长 度 一 般 都 小 于 30cm， 因 此 大 多 数 迹 线 可 以 建 模 为 理想 等 电势 线 。 相 反 ， 很 多 
现代 芯片 的 边缘 速率 为 2ns， 其 至 更 小 ， 所 以 长 度 大 于 6cm( 大 约 2.5 KT) 的 迹 线 都 需要 建 模 
为 传输 线 。 显 然 ， 使 用 超出 必要 的 边沿 速率 将 给 设计 师 带 来 困难 。 

由 于 实验 电路 板 缺 少 地 线 层 ， 所 以 每 个 信号 的 电磁 场 都 不 规则 且 很 难 建 模 。 而 且 ， 信 和 号 之 
间 的 电磁 场 相互 作用 ， 这 使 得 信号 之 间 的 反射 和 串扰 更 加 强烈 。 因 此 ， 当 工作 频率 超过 几 兆 赫 
效 时 ， 实 验 电 路 板 就 不 可 靠 了 。 

相反 ， 印 刷 电路 板 在 整个 传输 线 上 有 比较 稳定 的 特性 阻抗 和 传输 速度 。 只 要 它们 终止 于 源 
阻抗 或 负载 阻抗 且 它们 与 传输 线 的 特性 阻抗 匹配 ， 印 刷 电 路 板 上 就 不 会 受到 反射 的 影响 。 


A. 8.6 正确 的 传输 线 终端 


图 A-32 给 出 了 两 种 常用 的 传输 线 终端 连接 方法 。 在 并 联 终 端 中 ， 驱 动 器 门 的 阻抗 很 低 
(Z,~0) 。 具 有 阻抗 Z。 的 负载 电阻 (2Z.) 与 负载 (在 接收 器 门 和 接地 之 间 ) 并 联 。 当 驱动 器 开关 
电压 从 0 ~ Vm 时 ， 它 将 沿线 发 送 电 压 为 Vbo 的 波 。 波 被 匹配 负载 终端 吸收 ， 不 产生 反射 。 在 训 
联 终端 中 ， 源 电阻 (2Zs ) 与 驱动 器 串联 以 便 将 源 阻抗 提高 到 Zu。 此 时 负载 为 高 阻抗 (Z, =o). 
当 驱 动 器 开关 时 ， 它 沿 传输 线 发 送 电压 为 foo72 的 波 。 波 在 开路 终端 负载 反射 并 返回 ， 将 线 上 
的 电压 升 为 Voo 波 在 源 终 端 被 吸收 。 这 两 种 电路 在 接收 端的 电压 变化 相同 ， 都 在 1 =i, 时 变 为 
Yo ， 这 正 是 我 们 所 和 硕 望 的 。 它 们 的 区 别 在 于 功 耗 和 在 传输 线 其 他 地 方 出现 的 波形 。 在 线 为 高 
电 平 并 联 终端 时 持续 消耗 电能 。 因 为 负载 连接 在 开路 上 ， 串 联 终端 不 产生 任何 直流 功 耗 。 然 
而 ， 在 串联 终端 的 传输 线 中 ， 接 近 传 输 线 中 间 的 点 的 起 始 电压 为 Wo/2， 直 到 反射 波 返回 后 才 
变 成 oo。 如 果 其 他 门 连接 在 线 的 中 间 ， 这 些 门将 接收 到 一 个 非法 的 逻辑 电 平 。 因 此 ， 串 联 终 
端 最 适合 只 有 一 个 驱动 器 和 一 个 接收 器 的 点 到 点 通信 方式 。 并 联 终端 方式 适合 有 多 个 接收 器 的 
总 线 ， 因 为 线 中 间 的 接收 器 不 会 接收 到 非法 的 逻辑 电 平 。 


A. 8.7 的 推导 


Zo 是 波 沿 着 传输 线 传播 过 程 中 电压 与 电流 之 比 。 本 节 将 推导 Zu， 这 需要 有 关于 电阻 -~ 电 
导 一 电容 ( Resistor-inductor-capacitor，RLC) 电 路 分 析 的 前 导 知 识 。 

考虑 将 跳 变 电压 应 用 到 半 无 限 传输 线 的 输入 (因此 无 反射 ) 。 图 A-33 给 出 了 半 无 限 传输 线 
和 长 度 为 dx 的 一 段 传 输 线 的 模型 。R、L、C 分 别 是 单位 长 度 的 电阻 、 电 感 和 电容 。 图 A-33b 
Si TARR 的 传输 线 模型 。 因 为 在 传输 过 程 中 有 能 量 消耗 在 电阻 上 ， 所 以 这 种 模型 称 为 有 
损 (lossy ) 传输 线 模 型 。 然 而 ， 这 种 损耗 往往 可 以 忽略 不 计 ， 从 而 忽略 电阻 元 件 而 简化 分 析 。 这 
种 模型 称 为 理想 传输 线 ， 如 图 A-33c 所 示 。 

经 过 传输 线 的 电流 和 电压 是 空间 和 时 间 的 函数 ， 如 式 ( A-8) 和 式 ( A-9) 所 示 。 


二 人 = DEN at) (A-8) 
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图 A-32 终端 方案 
Rdx Ldx Ldx 
- MAS OT DLL Cc a wun PL. 
toe : 于 eu 于 cdr 
dx dx dx 
a) 半 无 限 长 传输 线 b) 有 损 传输 线 c) 理想 传输 线 


图 A-33 ”传输 线 模型 
HB = CL V(x,t) (A-9) 
对 式 (A-8) 求 对 空间 的 导数 ， 对 式 (A-9) 求 对 时 间 的 导数 ， 并 带 和 就 可 以 得 到 波 方 程 
式 ( A-10): 
© vey 4) A E ÈN ‘ 
SV x,t) = LC ENa) (A-10) 
2 传输 线 中 电压 和 电流 之 比 ， 如 图 A-34a 所 示 。 由 于 波 的 行为 不 依赖 于 距离 ， 所 以 2 必须 


与 传输 线 的 长 度 无 关 。 因 为 它 与 长 度 无 关 ， 所 以 在 增加 了 一 小 段 长 度 为 dx 的 传输 线 之 后 ， 其 
特性 阻抗 也 必须 是 Zo, WME A-34b 所 示 。 





人 一 下 了 
十 | nN ] 
re jac 
dx 
a) 整个 线 模型 b) 增加 了 dx 长 度 


A-34 ”传输 线 模型 
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考虑 电感 和 电容 的 阻抗 后 ， 我 们 可 以 用 以 下 方程 重 写 图 A-34 的 关系 : 
Z, = jwLdx + [ Z, || (1/jwCdx) ] (A-11) 
重 写 式 (A-11) ， 可 以 得 到 ， 
Z3(jwC) -jwL + w Z,LCdx = 0 ( A-12) 
当 dx 趋 近 于 0 时 ， 最 后 一 项 可 以 忽略 ， 得 到 ， 


人 + ( A-13) 


A. 8.8 反射 系数 的 推导 ” 


基于 电流 守恒 原理 可 以 推导 出 反射 系数 k。 在 图 A-35 中 传 s= LE 
输 线 的 特性 阻抗 为 Z ， 负 载 阻抗 为 Z  。 假 设 和 人 射 波 电压 为 VY， 2 一 |, 


电流 为 上。 当 波 达 到 终点 时 ， 有 些 电流 RENREN, PE zjn 
电压 降 Vo HRERELHIEARE, EBEN V,, BRN : 
1,。Z, 为 传输 线 中 波 的 电压 和 电流 之 比 ， 因 此 有 于 = 了 = Z。 图 A-35 传输 线 的 人 射 、 反 英 


传输 线 上 的 电压 是 人 射 波 和 反射 波 的 电压 之 和 ， 正 向 电流 EANGI kia 
是 入射 波 电流 与 反射 波 电流 的 差 。 
yy SM N (A-14) 
chalice (A-15) 
(8 FAD We FRE (A-15) PAT, TAT, AIFS, 
V+V VV SY, 








-> me 
从 此 式 可 以 得 到 反射 系数 此: 
Site, eR oh A-17 
V RY i ARNT) 
A.8.9 小 结 


由 于 光速 是 有 限 的 ， 所 以 传输 线 模型 刻画 了 信号 沿线 传播 需要 时 间 这 一 事实 。 理 想 的 传输 线 
具有 一 致 的 单位 长 度 电 感 L 和 电容 C， 而 且 电 阻 为 0。 传 输 线 由 它 的 特性 阻抗 Zu 和 延迟 i 来 描述 。 
这 两 个 参数 可 以 从 单位 长 度 电感 、 电 容 和 线 长 度 推 导出 来 。 传 输 线 对 上 升 / 下 降 时 间 小 于 St, Af 
号 有 明显 的 延迟 和 噪声 影响 。 这 意味 着 ， 当 系统 的 上 升 /下 降 时 间 为 2ns 时 ， 如 果 印 刷 电路 板 的 迹 
线 长 度 超过 6cm 时 ， 就 需要 采用 传输 线 模型 进行 分 析 ， 以 便 得 到 其 精确 形 为 。 

当 数字 系统 包含 了 连接 在 第 二 个 门 的 长 线 驱动 的 逻辑 门 时 ， 就 可 以 使 用 传输 线 对 它 进 行 


模 ， 如 图 A-36 所 示 。 电 压 源源 阻抗 Z. 和 开关 ”驱动 i] — 接收 门 
对 在 时 刻 0 从 0~1 的 第 一 个 门 开关 建 模 。 驱 动 5 
器 门 不 能 提供 无 限 大 的 电流 ， 这 可 以 由 Z Æ a) 


模 。 逻 辑 门 的 Z, 一 般 比 较 小 ， 但 设计 者 可 以 选 
择 在 门 上 串联 一 个 电阻 来 增加 Zs， 以 便 匹 配 线 
的 阻抗 。 第 二 个 门 的 输入 作为 Zo CMOS 电路 
的 输入 电流 往往 很 小 ， 因 此 Zi 可 接近 无 限 大 。 
设计 者 可 以 选择 在 第 二 个 门 的 输入 和 地 之 间 增 
加 一 个 并 联 的 电阻 ,使 和 匹配 传输 线 的 阻抗 。 
当 第 一 个 门 开关 时 ,将 电压 波 驱 动 到 传输 图 A-36 ”用 传输 线 对 数字 电路 建 模 
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线 上 。 源 阻抗 和 传输 线 构成 分 压 器 ， 因 此 人 射 波 的 电压 为 : 
Zo 
© Z + Be 
在 如 时 ， 波 到 达 线 的 终端 。 一 部 分 波 被 负载 阻抗 吸收 ， 一 部 分 波 被 反射 。 反 射 系数 天 指出 
反射 的 部 分 : =VAV;， 其 中 VV 为 反射 波 的 电压 ,VV 为 人 射流 的 电压 。 
Zi Pù Lo 
see oat 2 
反射 波 和 至 加 到 传输 线 上 的 已 有 的 电压 ， 并 在 2t, 时 到 达 源 。 此 时 ， 又 有 一 部 分 波 被 吸收 ， 一 
部 分 被 反射 。 反 射 过 程 持续 进行 ， 线 上 的 电压 最 终 将 趋 近 于 稳定 ， 此 时 传输 线 成 为 等 电势 线 。 


A.9 经 济 问 题 

虽然 数字 电路 设计 非常 有 趣 ， 很 多 人 乐意 无 偿 做 ， 但 是 大 多 数 设计 者 和 公司 希望 从 中 赢 
利 。 因 此 ， 经 济 问题 是 设计 决策 中 一 个 重要 的 考虑 因素 。 

数字 电路 的 花费 可 以 分 为 不 可 回收 费用 (Nonrecurring Engineering Cost, NRE) 和 可 回收 费用 
(recurring cost), NRE 决定 了 系统 设计 的 成 本 ， 包 括 设 计 成 员 的 报酬 、 计 算 机 和 软件 成 本 、 生 
产 第 1 版 产品 的 费用 。2012 年 ， 一 个 美国 设计 人 员 的 所 有 费用 (包括 薪水 、 健 康 保 险 、 退 休 保 
险 、 设 计 工 具 和 计算 机 ) 大 约 为 每 年 20 万 美元 ， 因 此 设计 成 本 比重 非常 高 。 可 回收 费用 是 每 增 
加 一 个 产品 所 需要 的 费用 ， 这 包含 了 元 器 件 、 制 造 、 市 场 、 技 术 支 持 和 分 发 。 

销售 价格 不 仅 包括 系统 的 成 本 ， 而 且 还 包括 办 公 室 场地 租金 、 税 、 非 直接 设计 人 员工 资 
(例如 ， 门 卫 和 CE0O) 等 。 在 去 除 这 些 费 用 后 ， 公 司 才能 获得 利润 。 

BEN 试图 挣 钱 

Ben Btiddidle 设计 了 一 个 巧妙 的 雨滴 计数 电路 。 他 决定 销售 这 些 设 备 来 赚钱 ， 但 是 他 需要 
决定 使 用 何 种 实现 方法 。 有 两 种 方法 可 以 选择 : FPGA 和 ASIC。 设 计 和 测试 FPGA 的 开发 工具 
的 价格 是 1500 美元 ， 每 个 FPGA 的 成 本 是 17 美元 。 制 作 ASIC 掩 膜 的 成 本 是 60 万 美元 ， 每 片 
ASIC 的 生产 成 本 是 4 美元 。 

无 论 选择 何 种 芯片 实现 方式 ，Ben 需要 在 印刷 电路 板 上 组 装 芯 片 。 每 个 印刷 电路 板 需要 
1.5 美元 。Ben 希望 每 个 月 能 销售 1000 Bi, Ben 召集 一 组 本 科 生 设计 这 个 芯片 作为 他 们 的 
毕业 设计 ， 因 此 不 需要 设计 成 本 。 

如 果 销 售 价格 是 成 本 的 2 倍 (100% 的 利润 空间 )， 产 品 周 期 为 2 年， 那么 哪 种 实现 方式 比 
较 好 呢 ? 

解 : Ben 绘制 了 一 个 两 种 实现 方式 在 2 年 内 的 总 成 本 表 ， 如 表 A-4 所 示 。2 年 后 ，Ben 将 
销售 24 000 个 设备 ， 表 A-4 给 出 了 不 同 选 择 的 所 有 成 本 。 如 果 产 品 周 期 仅 为 2 年 ， 则 FPGA 实 
现 明 显 是 更 好 的 选择 。 每 个 设备 的 成 本 为 $445 000/24 000 = $18. 56， 在 100% 利润 空间 下 ， 销 
售 单价 是 37. 13 美元 。ASIC 实现 的 成 本 为 $732 000/24 000 = $30, 50 ， 销 售 单价 为 61 美元 。 


表 A-4 ASIC 5 FPGA 成 本 





V = 了 (A-18) 





(A-19) 


成 本 ASIC FPGA 
NRE $600 000 $1500 
每 个 芯片 $4 $17 
PCB $1. 50 $1. 50 
总 计 $600 000 + (24 000 x $5.50) = $732 000 $1500 + (24 000 x $18.50) = $445 500 
单价 $30. 50 $18. 56 
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BEN 更 加 贪 梦 

在 看 到 产品 的 市 场 广告 后 ，BEN 觉得 他 可 以 比 原先 预期 每 个 月 销售 更 多 的 产品 。 如 果 他 选 
择 ASIC 实现 ， 每 个 月 需要 销售 多 少 个 产品 才能 使 ASIC 实现 比 FPGA 实现 更 加 有 利 ? 

解 : Ben 通过 下 述 方程 求解 2 年 内 最 小 的 销售 数量 N: 

$600 000 + (Nx $5.50) = $1500 + (Nx $18.50) 

此 方程 的 结果 为 N=46 039， 即 每 个 月 销售 1919 个 设备 。 他 需要 月 销售 量 增加 一 倍 才能 从 
ASIC 实现 中 获 利 。 < 

BEN 没有 这 人 么 贪 焚 

Ben 意识 到 他 的 胃口 太 大 了 ， 不 能 假定 每 个 月 能 卖 1000 个 设备 。 但 是 ， 他 认为 产品 周期 可 
能 会 超过 2 年 。 如 果 设 备 每 月 的 销售 量 为 1000 个 ， 那 么 产品 周期 需要 多 长 才能 使 得 ASIC 实现 
更 为 合算 ? 

解 : 如 果 Ben 总 共 可 以 销售 46 039 个 设备 ， 那 么 ASIC 实现 就 是 最 佳 选择 。 因 此 ，Ben 在 
每 个 月 销售 1000 个 设备 时 他 需要 销售 47 个 月 (加 上 取 整 ) ， 大 约 4 年 时 间 。 那 时 ， 他 的 产品 将 
会 被 淘汰 。 < 

必 片 往往 都 是 从 分 销 商 那里 购买 的 ， 而 不 是 直接 从 制造 商 购买 (除非 你 购买 上 万 个 芯片 )。 
Digikey( www . digikey .com) 是 一 个 销售 多 种 电子 元 件 的 优秀 分 销 商 。Jameco( www.jameco. 
com) 和 All electronics( www .allelectronics.com) 也 都 有 适合 于 爱好 者 且 价 格 有 竞争 力 的 
丰富 产品 目录 。 
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Digital Design and Computer Architecture, Second Edition 


MIPS 指令 





本 附录 总 结 了 本 书 使 用 的 MIPS 指令 。 表 Bl ~ # B3 定义 了 每 条 指 
AHJ opcode 和 funct 字段 ， 并 对 指令 的 功能 做 了 简单 的 说 明 。 使 用 以 


下 符号 : 
e. [reg]: 寄存 器 的 内 容 
è Imm: I 类 型 指令 的 16 位 立即 数字 段 
e Addr: J 类 型 指令 的 26 位 地 址 字段 


e SignImm: 32 位 符号 扩展 的 立即 数 
= {{16{imm[15]}}, imm} 
e ZeroImm: 32 位 0 扩展 的 立即 数 


= {16'b0O, imm} 
e Address: [rs] + SignImm 
© [Address]: 存储 器 单元 Address 的 内 容 
è BTA: 分 支 目 标 地 址 ° 
= PC + 4 + (SignImm << 2) 
e JTA: 跳 转 目标 地 址 
= { (PC + 4) (31: 28], addr, 2'b0} 
e label: 指定 指令 地 址 的 文本 


表 B-1 # opcode 字段 排列 的 指令 
Oc 
00000 Tiel roe 


>"“hell 
应 用 软件 |” OS 
world! 





操作 


000001(1) bltz rs, label / if ({rs] <0) PC = BTA/ 
0 0 
{st = 0/1) bgez rs, label 小 于 0 转移 /大 于 等 于 0 转移 if ({rs] 20) PC = BTA 


0001002) TE 


000011 (3) 跳 转 并 链接 $ra = PC + 4, PC = JTA 
000100(4) 如 果 相 等 则 转移 if ({rs] == [rt]) PC = BTA 


000101 (5) 如 果 不 相等 则 转移 if ([rs] ! 


= [rt]) PC = BTA 


000111(7) if (Irs] > 0) PC = BTA 
TI a) = te 4 sige 
001001 (9) addiu rt, rs, imm [rt] = [rs] + SignImm 
001010( 10) [rs] < SignImm ? [rt] = 1 : [rt] =0 
001011(11) sltiu rt, rs, imm [rs] < SignImm ? [rt] =1: [rt] =0 


© SPIM 模拟 器 中 的 BTA 是 PC HSignImm <<2)， 因 为 它 没有 分 支 延 迟 槽 。 因 此 ， 如 果 你 使 用 SPIM 汇编 器 为 
真正 的 MIPS 处 理 器 创建 机 器 代码 ， 必 须 将 分 支 指令 的 立即 数字 段 减 1 来 进行 补偿 。 
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Opcode 
001100( 12) 
001101 (13) 
001110(14) 
001111(15) 
010000 ( 16 ) 
(rs =0/4) 
010001 ( 17) 
010001 (17) 
(rt. = 073) 
011100( 28) 
(func =2) 
100000 (32 ) 
100001 (33 ) 
100011 (35) 
100100 ( 36 ) 
100101 (37) 
101000 (40) 
101001 (41) 
101011(43) 
110001 (49 ) 
111001 (56) 


Funct 

000000 (0) 
000010 (2) 
000011 (3) 
000100(4) 
000110(6) 
000111(7) 
001000(8) 
001001 (9 ) 
001100( 12) 
001101(13) 
010000( 16) 
010001 (17) 
010010(18) 
010011(19) 
011000( 24) 
011001 (25) 


011010( 26) 


andi rt, 
Or rE, 
NOY EPE 


lui rt, 


N 
= 


rs, imm 
rs, imm 
rs, imm 


imm 


mfcO rt, ra 7 
mtcO rt, rd 


F = type 


bci £ label/ 
bcit label 


mul rd Esp ct 


Ib rtt; 
Li rE, 
lw rt, 


lbu rt, 


Thu rt 


imm (rs) 

imm (rs) 

imm (rs) 

imm (rs) 


, imm(rs) 


sb rt,. imm(rs) 


sh rt, imm(rs) 


sw rt, imm(rs) 


lwel ft, 


swcl ft, 


imm (rs) 


imm (rs) 


者 


立即 数 与 

立即 数 或 

立即 数 异 或 

装 入 立即 数 的 高 16 位 


从 协 处 理 器 0 移出 / 移 人 协 
处 理 需 0 


fop =16/17: 了 类 型 指令 


fop =8: 如 果 fpcond 为 
FALSE/TRUE 则 转移 


乘法 (32 位 结果 ) 


装 人 字 节 

RAFF 

RAT 

装 人 无 符号 字 节 

Be A TORT SEF 
存储 字 节 

存储 半 字 

存储 字 

将 字 装 人 到 FP 协 处 理 器 1 中 
将 字 存 储 到 FP 协 处 理 器 1 中 


[rt] 


[rt] 


[rt] 


[rt] 


(EEJ 


[rt] 
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(2) 
操作 
[rs] & ZeroImm 
[rs] | ZeroImm 
[rs] ^ ZeroImm 
{imm, 16'b0} 


[rd]/ [ra] = [rt] 


(rd is in coprocessor 0) 


见 表 B-3 


if (fpcond == 0) PC = 
if (fpcond == 1) PC 


[rd] 


[rt] 


[rt] 


[rt] 


[rt] = 


BTA/ 
BTA 


[rs] x [rt] 


SignExt ([Address],.,) 
SignExt ([Address],5.9) 
[Address] 

ZeroExt ([Address],..) 
ZeroExt ([Address],5.9) 


[Address] 3.9 = [rt]+.o 


[Address ]15., = [rtlis-o 


表 B-2 # funct 字段 排列 的 R 类 型 指令 


指令 名 字 


sll rd, xt, shamt 
srl rd, 


sra rd, rt, shamt 


rt, 


SLIV 2G, TE; TB 


Stiv ra, xt, Fs 


srav rd, rt, rs 


jr rs 


jalr rs 


syscall 


break 


mfhi rd 


mthi rs 


mflo rd 


mtlo rs 


mult rs, rt 


multu rs, 


div rs, 


i 


rE 


A g HIN E 
w >| | S| ğ 
z x | 2 

Z |È 

R 

a 

at 

He 


ct 


shamt 


指令 描述 
逻辑 左 移 


变量 的 逻辑 左 移 
变量 的 逻辑 右 移 
变量 的 算术 右 移 


SS | SE | Se | SE | | Re 
局 > | it 
at ùt | Of 
tt S/S 
3E 


从 hi 寄存 器 中 移出 
i 寄存 器 

M lo 寄存 器 中 移出 

移入 lo 寄存 器 


无 符号 乘法 


[Address] = [rt] 
[ft] = [Address] 
[Address] = [ft] 

操作 
[rd] = [rt] << shamt 
[rd] = [rt] >> shamt 
[rd] = [rt] >>> shamt 
[rd] = [rt] << [rs]4.o 
[rd] = [rt] >> [rs] 4. 
[rd] = [rt] >>> [rs]4q.o 
PC = [rs] 


Sra = PC + 4, PC = 


[rs] 


system call exception 


break exception 


[rd] = 
[hi] = 
[rd] 
[lo] = 
{ [hil], 
{ [hi], 


[lo] 
[hi] 


[hi] 

[rs] 

[lo] 

[rs] 

[lo]}. = [rs] x [rt] 
[lo]} = [rs] xX [rt] 
[rs]/ [rt], 

[rs]% [rt] 
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( 2) 
Funct 指令 名 字 指令 描述 操作 
011011(27) | divu rs, rt 无 符号 除法 | sie ig tn 
100000 32) [rd] = [rs] + [rt] 
100001 (33) [zd] = [rs] + [rt] 
10001034) [za] = [rs] - [rt] 
100011 (35) subu rd, rs, rt [rd] = [rs] - [rt] 
0010036) ea) = Te T [ee 
100110( 38) xor rd, rs, rt (ai = [xs] » [rt] 
100111(39) nor rd, rs, rt 或 非 [rd] = » ([rs] | [rt)) 
101010( 42) [rs] < [rt] ? [rd] =1: [rd] = 
101011(43) | situ rd, rs, rt [rs] < [rt] ? [rd] =1: [rd] = 


R B-3 F 类 型 指令 (fop = 16/17) 


Funet 操作 


add 3s fd, fs, ft / 
add.d fd, fs, ft 


subes- fd, fs, £t./ 

000001 ( 1 FP f re 本 
mul...s fa, fs, ft / 

000010(2 FP x 


000000 (0) FP 加 法 [fd] = [fs] + [ft] 


div.s fd, fs, ft / 
000011 (3 FP 除 z 
abs.s fd, fs / (fd] = ({fs] <0) ? [-fs] 
000101 (5 FP i 
(5) abs.d fd, fs 取 绝 对 什 : [fs] 
neg.s fd, fs / 
000111 (7 FP =[- 
-. . f f ft 
111010(58) LERLA / FP 相等 比较 fpcond = ({fs] == [ft]) 
c.seq.d fs, ft 
CLES fs, LEA 
111100(60 FP = 
(60) Te 小 于 比较 fpcond = ([fs] < [ft]) 
Pah fe; Ft 
生生 村 可 的 一 -外 全 FP 小 于 或 等 于 比较 fpcond = ([fs] <[ft]) 
Gyn ft 
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本 书 的 总 体 目标 是 阐述 计算 机 如 何在 许多 抽象 层次 上 工作 ， 从 构成 计算 机 的 晶体 管 层 一 直 
到 计算 机 运行 程序 的 软件 层 。 本 书 的 前 5 章 讲 述 较 低 的 抽象 层次 ， 从 晶体 管 到 逻辑 门 再 到 逻辑 
设计 。 第 6 ~8 章 跳 到 体系 结构 层次 ， 并 讲述 微 结构 层 以 连接 硬件 和 ”6 ae 
软件 。 本 附录 描述 的 C 语言 编程 逻辑 位 于 第 5 章 和 第 6 章 之 间 , 将 C OP | 
语言 编程 作为 本 书 的 最 高 抽象 层 。 它 促进 体系 结构 内 容 的 发 展 ， 并 将 
本 书 链接 到 读者 可 能 已 经 熟悉 的 编程 体验 。 被 这 些 内 容 置 于 附录 中 ， 
是 为 了 使 读者 可 以 很 容易 地 根据 自身 经 验 选择 阅读 或 者 跳 过 它 。 

程序 员 使 用 许多 不 同 的 语言 来 告诉 计算 机 要 做 什么 。 从 根本 上 
说 ， 机 器 语言 中 计算 机 处 理 指 令 是 由 1 和 0 构成 ， 如 第 6 章 所 探讨 的 。 
但 使 用 机 器 语言 进行 编程 ， 繁 琐 而 且 较 慢 ， 导 致 程序 员 采 用 更 抽象 的 
语言 ， 以 便 更 有 效 地 表达 它们 的 含义 。 表 C-1 列 出 了 一 些 在 各 种 抽象 
层次 的 编程 语言 例子 。 


表 C-1 按照 大 致 递减 抽象 层次 排列 的 编程 语言 





编程 语言 描述 
Matlab 旨 在 方便 大 量 使 用 数学 函数 
Perl 专 为 脚本 处 理 设计 
Python 强调 代码 可 读 性 
Java 在 任何 计算 机 上 安全 运行 
C 设计 考虑 灵活 性 和 整个 系统 的 访问 ， 包 括 设 备 驱 动 程序 
汇编 语言 人 类 可 读 的 计算 机 语言 
机 器 语言 程序 的 二 进 制 表示 


其 中 一 个 最 流行 的 编程 语言 是 C 语言 。 它 由 一 个 包括 Dennis Ritchie 和 Brian Kernighan 的 小 
组 于 1969 年 至 1973 年 在 贝尔 实验 室 创建 的 ， 以 便 重 写 原 来 由 汇编 语言 编写 的 UNIX 操作 系统 。 
从 很 多 方面 来 看 ，C( 包 括 C++ 、C# 和 Objective C 等 密切 相关 的 语言 族 ) 是 目前 使 用 最 广泛 的 
语言 。 它 的 普及 源 于 多 种 因素 ， 包 括 : 

© 可 用 于 各 种 平台 ， 从 超级 计算 机 到 通信 式微 控制 需 。 

。 相对 易 用 性 ， 具 有 庞大 的 用 户 群 。 

。 适度 的 抽象 层次 ， 提 供 比 汇编 语言 更 高 的 生产 力 ， 但 也 让 程序 员 很 好 地 理解 代码 将 如 

何 执行 。 

。 适用 于 生成 高 性 能 程序 。 

。 直接 与 硬件 交互 的 能 力 。 

本 章 专注 于 C 语言 ， 是 有 多 种 原因 的 。 最 重要 的 是 ，C 语言 允许 程序 员 直 接 访 问 存储 顺 中 
的 地 址 ， 曾 明 本 书 中 强调 的 硬件 和 软件 之 间 的 连接 。C 是 一 种 实用 语言 ， 所 有 的 工程 师 和 计算 
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机 科学 家 都 应 该 知道 它 。 它 在 实现 和 设计 等 许多 方面 的 应 用 (例如 ， 软 件 开发 、 艇 入 式 系 统 编 
程 ， 以 及 模拟 ) ， 使 得 精通 C 语言 成 为 一 个 重要 和 适合 人 才 市 场 的 技能 。 

后 面 各 节 摘 述 C 程序 的 整体 语法 ,讨论 程序 的 每 个 部 分 ， 包括 头 部 、 函 数 和 变量 声明 、 数 
据 类 型 ， 以 及 程序 库 中 提供 的 常用 函数 。8.6 节 描 述 了 一 个 实际 应 用 程序 ， 它 使 用 C 语言 来 对 
PIC32 单片机 进行 编程 。 


小 结 


。 高 级 编程 : 高 级 编程 在 很 多 设计 层次 是 非常 有 用 的 ， 从 写 分 析 或 模拟 软件 到 编写 与 硬 
件 交 互 的 微 处 理 需 程序 。 

。 低层 次 访问 : C 代码 是 强大 的 ， 因 为 除了 高 层次 构建 外 ， 它 还 提供 了 对 底层 硬件 和 内 
存 的 访问 。 


C.2 欢迎 来 到 C 语言 


C 程序 是 描述 计算 机 操作 的 文本 文件 。 文 本 文件 被 编译 ， 转 换 成 机 器 可 读 格 式 ， 并 在 计算 
机 上 运行 或 执行 。C 代码 示例 C. 1 是 一 个 简单 的 C 程序 ， 它 输出 短语 “Hello world!” 到 控制 
台 ， 即 计算 机 屏幕 上 。%C 程序 通常 包含 在 一 个 或 多 个 以 “. ce” 结尾 的 文本 文件 中 。 和 良好 的 编程 
风格 要 求 文 件 名 能 表明 程序 的 内 容 ， 例 如 ， 该 文件 可 以 称 为 hello.c. 


C 代码 示例 C. 1 简单 程序 


// Write "Hello world!" to the console 
#include <stdio.h> 


int main(void) [ 
printf ("Hello world! \n"); 
| 


控制 台 输 出 


Hello world! 


C.2.1 C 程 序 解剖 


一 般 情况 下 ，C 程序 由 一 个 或 多 个 函数 组 成 。 每 个 程序 必须 包括 main KA ERR), € 
是 程序 开始 执行 的 地 方 。 大 多 数 程序 使 用 在 C 代码 其 他 地 方 和 /程序 库 中 定义 的 其 他 函数 。 
hello.c 程序 的 所 有 部 分 是 头 部 、main( 主 ) 函数 和 函数 体 。 

头 部 : #include <stdio.h> 

头 部 包括 该 程序 所 需 的 库 函 数 。 在 本 例 中 ， 程 序 使 用 printf 函数 ， 这 是 标准 WO EK% 
stdio. h 的 一 部 分 。 关 于 C 语言 内 置 库 函 数 的 详细 内 容 参 见 C.9 他。 

主 函 数 : int main (void) 

所 有 C 程序 必须 正好 包含 一 个 main 函数 ( 主 函数 )。 通 过 运行 main 函数 中 的 代码 来 执行 
程序 ， 称 为 主 函数 体 。 函 数 语法 在 C.6 节 描 述 。 函 数 体 包含 语句 序列 ， 每 条 语句 都 以 分 号 结 
Ro int 表示 main 函数 输出 或 返回 一 个 整数 结果 ， 该 结果 反映 程序 是 否 成 功 运 行 。 

mak: printf ("Hello world! \n"); 

main 函数 的 函数 体 包含 一 条 语句 ， 调 用 printf 函数 ， 它 输出 短语 “Hello world!” Ea 
面 跟着 一 个 特殊 序列 “\ n” 表 示 的 换行 符 。 有 关 IO 函数 的 更 多 细节 在 C. 9. 1 节 摘 述 。 

所 有 程序 按照 简单 的 hello.c 程序 的 一 般 格式 编写 。 当 然 ， 非常 复杂 的 程序 可 能 包含 数 
百 万 行 代码 和 数 百 个 文件 。 
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C. 2.2 运行 C 程序 


C eR A LACES AALS be. RAT BME C 语言 的 另 一 个 优点 。 程 序 首 先 在 
目标 机 器 上 使 用 C 编译 器 编译 。 存 在 略 有 不 同 的 C 编译 器 版 本 ， 包 括 cc(C 编译 器 ), 或 gee 
(GNU C 编译 器 ) 。 这 里 ， 我 们 将 说 明 如 何 使 用 gee 编译 并 运行 一 个 C 程序 ， Aaa PR AE AT LA He Be 
下 载 。 它 可 以 直接 运行 在 Linux 机 器 上 ， 也 可 以 在 Windows 机 器 上 通过 Cygwin 环境 访问 。 它 也 
可 用 于 许多 机 人 人 式 系统 ， 如 Microchip PIC32 微 控 制 器 。 下 面 描述 的 C 文件 创建 、 编 译 和 执行 的 
一 般 过 程 对 于 任何 C 程序 都 是 相同 的 。 

1) 创建 文本 文件 ,例如 ，hello.c。 

2) 在 终端 窗口 中 ,切换 到 包含 hello.c 文件 的 目录 ,在 命令 提示 符 处 键入 gce 
hello.cs 

3) 编译 器 创建 一 个 可 执行 文件 。 默 认 情 况 下 ， 可 执行 文件 名 为 a.out( 在 Windows PLat_E 
为 a.exe)。 

4) 在 命令 提示 符 处 ， 键 入 ./a.out( Æ Windows 上 为 . /a .exe)， 然后 按 回 车 键 。 

5) “Hello world!” 将 出 现在 屏幕 上 。 


小 结 
e filename.c: C 程序 文件 的 扩展 名 通常 为 . co 
e main: 每 个 C 程 序 必 须 有 正好 一 个 main AR. 
e #include: 大 多 数 C 程序 使 用 内 置 库 提供 的 函数 。 通 过 在 C 文件 的 顶部 包含 #in- 
clude <library.h > HE AE FA IK He pK AL. 
e gcc filename.c: 使 用 编译 器 ， 如 GNU 编译 器 (gcc) 或 C 编译 器 (cc) 将 C 文件 转换 
成 可 执行 文件 。 
© 执行 : 编译 后 ， 通 过 在 命令 行 提 示 符 处 键入 ./a.out( 或 ./a.exe) 来 执行 C 程序 。 
C.3 编译 


编译 器 是 一 种 软件 ， 它 读 取 高 级 语言 编写 的 程序 并 将 其 转换 成 机 融 代 码 文件 ， 即 可 执行 文 
件 。 整 本 书 都 在 论述 编译 器 ， 但 我 们 在 这 里 简单 描述 编译 占 。 编 译 希 的 整体 操作 是 : 1) 通 过 包 
含 引 用 库 和 扩大 宏 定义 来 预 处 理 文件 ; 2) 忽 略 所 有 不 必要 的 信息 ， 如 注释 ; 3) 将 高 级 代码 转 
换 成 用 二 进 制 表示 的 本 地 处 理 顺 的 简单 指令 ， 即 机 顺 霹 言 ; 4) 将 所 有 指令 转换 成 一 个 可 由 计算 
机 读 取 和 执行 的 简单 二 进 制 可 执行 文件 。 每 种 机 器 语言 特定 于 一 个 给 定 的 处 理 磊 ， 因 此 程序 必 
须 专门 为 其 将 要 运行 的 系统 进行 编译 。 例 如 ， 第 6 章 详 述 的 MIPC 机 器 语言 。 


C. 3.1 注释 


程序 员 使 用 注释 在 一 个 较 高 的 层次 来 描述 代码 和 澄清 代码 功能 。 阅 读 过 未 加 注释 代码 的 任 
何人 都 可 以 证 明 它 们 的 重要 性 。C 程序 使 用 两 种 类 型 的 注释 : 单行 注释 ， 以 NY 开始 并 在 该 行 末 
尾 终止 ; 多 行 注 释 ， 以 A/ * 开始 并 * /结束 。 虽 然 注释 对 于 程序 的 组 织 和 清晰 度 是 很 关键 的 ， 但 
编译 时 它们 会 被 编译 上 项 忽略 。 

// This is an example of a one-line comment. 


/* This is an example 
of a multi-line comment. */ 


在 每 个 C 文件 顶部 的 注释 是 非常 有 用 的 ， 它 用 来 描述 文件 的 作者 、 创 建 和 修改 日 期 ， 以 及 
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程序 用 途 。 下 面 的 注释 可 以 包含 在 hello.c 文件 的 顶部 。 


// hello.c 

// 1 June 2012 Sarah_Harris@hmc.edu, David_Harris@hmc.edu 
EF 

// This program prints "Hello world!" to the screen 


C.3.2 +#define 


常量 使 用 #define 指令 命名 ， 然 后 在 整个 程序 中 按 名 称 使 用 。 这 些 全 局 定义 的 常量 也 称 
HE. iM, 假设 你 写 了 一 个 程序 ， 人 允许 至 多 5 个 用 户 猜 测 ， 你 可 以 使 用 #define 标识 这 个 
数字 。 | 

#define MAXGUESSES 5 

程序 中 含有 # 的 程序 行将 由 预 处 理 器 处 理 。 在 编译 之 前 ， 预 处 理 器 将 程序 中 每 一 个 标识 符 
MAXGUESSES 替换 为 5。 按 照 惯例 ，#define 行 位 于 该 文件 的 顶部 ， 标 识 符 全 部 为 大 写字 母 。 
通过 在 某 个 位 置 定 义 常 数 ， 然 后 在 程序 中 使 用 标识 符 ， 程 序 将 保持 一 致 ， 并 且 常 数值 容易 被 修 
改 一 一 它 仅 需 要 在 #define 行 改变 ， 而 不 是 在 代码 中 需要 该 常数 值 的 每 一 行 。 

C 代码 示例 C. 2 说 明 如 何 使 用 #define 指令 将 英寸 转换 成 厘米 。 变 量 inch 和 cm 声明 为 
float， 表 示 它 们 为 单 精 度 浮 上 点数。 如果 转换 因子 (INCH2CM) 在 整个 大 程序 中 使 用 ， 使 用 # 
define 声明 它 来 避免 由 于 拼写 错误 带 来 的 错误 (例如 ， 键 和 2. 53 而 不 是 2.54) ， 并 使 之 容易 
查找 和 更 改 ( 例 如 ， 如 果 要 求 更 多 的 有 效 数 字 ) 。 


C 代码 示例 C. 2 使 用 #define 来 声明 常数 


// Convert inches to centimeters 
#include <stdio.h> 


#define INCH2CM 2.54 


int main(void) { 
float inch=5.5; // 5.5 inches 
float cm; 


cm = inch * INCH2CM; 
printf("%f inches = %f cm\n", inch, cm); 
} 


控制 台 输 出 


5.500000 inches = 13.970000 cm 


C.3.3 #include 


FESR AL BL i FRAT RF AA ARR A ARA 4 Ei , EER 
使 用 。 位 于 头 文件 中 的 变量 声明 定义 值 和 函数 定义 可 以 通过 增加 #include 预 处 理 程序 指令 
由 另 一 个 文件 使 用 。 提 供 常 用 函数 的 标准 库 是 以 这 种 方式 访问 的 。 例 如 ， 需 要 下 面 的 代码 行使 
用 标准 输入 /输出 (0) 库 中 定义 的 函数 ,例如 printf。 

#include <stdio.h> 


包含 文件 的 “. hn” 后 缀 表明 它 是 一 个 头 文件 。 虽 然 #include 指令 可 以 放 在 需要 该 包含 晒 
数 、 变 量 或 标识 符 之 前 文件 中 的 任何 地 方 ， 但 它们 通常 放 在 C 文件 的 顶部 。 

程序 员 创建 的 头 文件 也 可 以 包含 在 程序 文件 中 ， 通 过 使 用 引号 ("") 围 住 文件 名 ， 而 不 是 
括号 ( < > )。 例 如 ， 用 户 创建 的 头 文件 名 为 myfunctions.h， 它 将 通过 下 面 的 代码 行 包 含 
在 程序 文件 中 。 
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#include "myfunctions.h" 


在 编译 时 ， 在 括号 中 指定 的 文件 在 系统 目录 中 搜索 。 在 引号 中 指定 的 文件 在 与 该 C 文件 同 
一 个 本 地 目录 中 搜索 。 如 果 用 户 创 建 的 头 文件 位 于 不 同 的 目录 中 ， 则 头 文件 相对 于 当前 目录 的 
路 径 必 须 包 含 在 该 C 文件 中 。 


小 结 


。 注释 : C 语言 提供 单行 注释 ( // ) 和 多 行 注释 (/* */). 

e #define NAME val: #define 指令 允许 一 个 标识 符 (NAME ) 在 整个 程序 中 使 用 。 在 编 
译 之 前 ， 所 有 NAME 的 实例 都 替换 为 val, 

e #include: #include 允许 在 程序 中 使 用 常用 肾 数 。 对 于 内 置 消 数 库 ， 在 代码 的 顶部 
包含 以 下 代码 行 : #include <library.h >。 为 了 包含 一 个 用 户 定 义 的 头 文件 ， 文 
件 名 必须 置 于 引号 内 ， 必 要 时 列 出 相对 于 当前 目录 的 路 径 ， 即 #include "other/my- 


Funcs Ah "oe 
C.4 变量 
C 程序 中 的 变量 含有 类 型 、 名 称 、 值 和 内 存 位 置 。 变 量 声明 指出 变量 的 类 型 和 名 称 。 例 
如 ， 下 面 的 声明 指出 变量 类 型 为 char( 这 是 一 个 1 字 节 类 型 ) ， 该 变量 名 称 为 x。 编 译 器 决定 
在 内 存 中 将 这 个 1 字 节 变量 放 在 哪里 。 


char x; 


C 语言 将 内 存 视 为 一 组 连续 的 字 节 ， 其 中 每 个 内 存 字 节 
分 配 一 个 唯一 的 数字 来 表示 其 位 置 或 地 址 ， 如 图 C-1 所 示 。 
一 个 变量 占用 内 存 的 一 个 或 多 个 字 节 ， 多 字 节 变量 的 地 址 由 
最 低 编号 字 节 来 表示 。 一 个 变量 的 类 型 表明 将 字 节 理解 为 整 
数 、 浮 点 数 或 其 他 类 型 。 本 节 的 其 余部 分 描述 C 语言 的 基本 
数据 类 型 、 全 局 和 局 部 变量 的 声明 ， 以 及 变量 的 初始 化 。 


C.4.1 基本 数据 类 型 内 存 


C 具有 许多 基本 或 内 置 数据 类 型 变量 。 它 们 可 以 大 致 分 OT CAMP 
为 整数 、 浮 点 变量 和 字符 。 一 个 整数 表示 在 有 限 范围 内 补 码 或 无 符号 数 。 浮 点 变量 使 用 EEE 
浮 点 表示 来 描述 在 有 限 范围 和 精度 内 的 实数 。 一 个 字符 可 以 视 为 ASCII 值 或 8 位 整数 9。 表 C-2 
列 出 每 个 基本 类 型 的 大 小 和 范围 。 整 数 可 以 是 16、32 或 64 位 。 它 们 通常 为 补 码 ， 除 非 定性 为 
unsigned( 无 符号 数 ) 。int 类 型 的 大 小 与 机 器 相关 ， 一般 为 机 器 的 原生 字 大 小 。 例 如 ， 在 一 
个 32 位 MIPS 处 理 器 上 ，int 或 unsigned int 的 大 小 是 32 位 。 浮 点 数 可 能 是 32 位 或 64 位 
单 或 双 精度 。 字 符 是 8 位 。 





表 C-2 基本 数据 类 型 和 大 小 


类 型 大 小 (位 ) 最 大 值 
unsigned char “tee 2° ~1 =255 


扣 ” 从 技术 上 来 说 ，C99 标准 定义 的 字符 为 适合 一 个 字 节 的 位 表示 ”， 不 要 求 一 个 字 节 是 8 位 。 然 而 ， 当 前 的 
系统 定义 一 个 字 节 为 8 位 。 
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( 续 ) 

类 型 最 大 什 
short 16 | =2 =~ 32768 | 2-1 = 32767 
unsigned short | 16 | 1 65535 
Long 2°! -1 =2 147 483 647 
unsignedlong | 32 | 2-1 4.294967 295 
long long Levee ie wcll | = Zz? 3 
unsigned tong | 6 | 0 | I 
int 与 机 器 相关 | | 
unsigned int | 与 机 器 相 | 
float 22 
double TT 


C 代码 示例 C.3 显示 了 不 同类 型 变量 的 声明 。 如 图 C-2 所 示 ，x 需要 一 个 字 节 的 数据 ，y 
需要 2 个 ，z 需要 4 个。 该 程序 决定 在 内 存 中 哪里 存储 这 些 字 节 ,但 每 种 类 型 总 是 需要 相同 大 
小 的 数据 。 为 了 便于 说 明 ， 在 本 示例 中 x、y 和 z 的 地 址 是 1、2 和 4。 变 量 名 是 区 分 大 小 写 
的 ， 所 以 变量 x 和 变量 x 是 两 个 不 同 的 变量 。( 不 过 ,在 同一 个 程序 中 同时 使 用 这 两 个 变量 将 
非常 混乱 !) 


Rt SS ee 
00000000 
EE | 


00101010 
ae 


7 
6 
5 
4 
3 
2 
l 
0 





图 C-2 CREARA C.3 的 内 存 中 的 变量 存储 
C 代码 示例 C. 3 ”数据 类 型 示例 


// Examples of several data types and their binary representations 
unsigned char x = 42; // x = 00101010 

short y =-10; // y =11111111 11110110 

unsigned long z = 0; // z = 00000000 00000000 00000000 00000000 


C. 4.2 全 局 变量 和 局 部 变量 


全 局 变量 和 局 部 变量 的 区 别 在 于 它们 在 哪里 声明 以 及 它们 在 哪里 可 见 。 全 局 变量 在 所 有 郴 
数 的 外 面 声明 ， 一 般 在 一 个 程序 的 项 部， 可 以 被 所 有 函数 访问 。 应 并 慎 使 用 全 局 变量 ， 因 为 它 
们 违反 了 模块 化 的 原则 ， 使 得 大 型 程序 更 加 难以 阅读 。 然 而 ， 许 多 函数 都 能 访问 的 变量 可 以 作 
为 全 局 变量 。 

局 部 变量 在 一 个 函数 内 声明 ， 只 能 被 该 函数 使 用 。 因 此 ， 两 个 函数 可 以 使 用 具有 相同 名 称 
的 局 部 变量 ， 而 不 互相 干扰 。 局 部 变量 在 函数 的 开始 声明 。 它 们 在 函数 结束 时 消除 ， 而 当 函 数 
再 次 调用 时 重新 创建 。 从 函数 的 一 次 调用 到 下 一 次 调用 ， 局 部 变量 不 保留 它们 的 值 。 

C 代码 示例 C.4 和 C. 5 对 使 用 全 局 变量 和 局 部 变量 的 程序 进行 比较 。 在 C 代码 示例 C.4 
中 ， 全 局 变量 max 可 被 任意 函数 访问 。 使 用 局 部 变量 ， 如 C 代码 示例 C.5 所 示 ， 是 更 好 的 编 
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程 风格 ， 因 为 它 保 留 了 模块 化 的 明确 定义 的 接口 。 
C 代码 示例 C.4 全 局 变量 


// Use a global variable to find and print the maximum of 3 numbers 
int max; // global variable holding the maximum value 


void findMax(int a, int b, intc) | 
max = a; 
if (b> max) { 
if (c >b) max = cC; 
else max = b; 
} else if (c > max) max =c; 
} 
void printMax(void) { 
printf("The maximum number is: %d\n", max); 
} 


int main(void) | 
findMax(4, 3, 7); 
printMax(); 

} 


C 代码 示例 C.5 局 部 变量 
// Use local variables to find and print the maximum of 3 numbers 


int getMax(int a, int b, intc) { 
int result=a; // local variable holding the maximum value 


if (b> result) { 
if (c> b) result =c; 
else result =b; 
} else if (c > result) result =c; 


return result; 
} 


void printMax(int m) { 
printf("The maximum number is: d\n", m); 
) 


int main(void) { 
int max; 


max = getMax(4, 3, 7); 
printMax(max); 
} 


C.4.3 变量 初始 化 


变量 需要 初始 化 ,在 它 被 读 取 之 前 赋值 。 当 声明 一 个 变量 时 ， 在 内 存 中 为 该 变量 保留 正确 
的 字 节 数 。 然 而 ， 在 那些 位 置 上 的 内 存 保留 它 上 一 次 使 用 时 的 值 ， 本 质 上 是 一 个 随机 值 。 全 局 
变量 和 局 部 变量 可 以 在 声明 时 或 程序 体内 被 初始 化 。C 代码 示例 C. 3 说 明 变量 在 它们 被 声明 的 
同时 进行 初始 化 。C 代码 示例 C. 4 说 明 变量 如 何在 声明 后 、 使 用 前 被 初始 化 ; 全 局 变量 max 由 
getMax 函数 在 它 被 printMax 函数 读 取 前 初始 化 。 读 取 未 初始 化 的 变量 是 一 种 常见 编程 错 
误 ， 而 且 调 试 起 来 可 能 非常 玉手 。 


小 结 
。 变量 : 每 个 变量 由 它 的 数据 类 型 、 名 称 和 内 存 位 置 定义 。 一 个 变量 以 这 种 方式 声明 : 


datatype name, 


C 语言 编程 407 


© 数据 类 型 : 数据 类 型 描述 一 个 变量 的 大 小 ( 字 节 数 ) 和 表示 方法 ( 字 节 的 解释 ) K C-2 
列 出 了 C 语言 内 置 数据 类 型 。 


。 AG: C 语言 将 内 存 视 为 字 节 列表 。 内 存 存 储 变量 并 且 将 每 个 变量 与 地 址 ( 字 节 数 ) 相 关联 。 

。 全 局 变量 : 全 局 变量 在 所 有 函数 之 外 声明 ， 并 且 可 以 在 程序 中 的 任何 地 方 访问 。 

。 局 部 变量 : 局 部 变量 在 一 个 函数 内 声明 ， 仅 可 以 在 该 函数 内 访问 。 

。 变量 初始 化 : 每 个 变量 必须 在 它 被 读 取 之 前 初始 化 。 初 始 化 可 以 在 声明 时 或 声明 后 发 
生 的 。 

C.5 运算 符 
在 C 程序 中 ， 最 常见 的 语句 类 型 是 表达 式 ， 例 如 
¥=a +3 


一 个 表达 式 包含 作用 于 一 个 或 多 个 操作 数 ( 如 变量 或 常数 ) 的 运算 符 ( 如 + 或 * )。C 支持 
的 运算 符 如 表 C-3 所 示 ， 按 类 别 并 以 优先 级 递减 的 顺序 排列 。 例 如 ， 乘 法 运算 符 的 优先 级 高 于 
加 法 运算 符 。 在 同一 类 别 内 ， 运 算 符 按照 它们 在 程序 中 出 现 的 顺序 执行 。 


表 C-3 ” 按 优先 级 递减 顺序 排列 的 运算 符 


x a 
++ att; //a ~ atl 
Ee eee tee 
a | 变量 的 内 存 地 址 | x = sy; // x = y 的 内 存 地 址 
ee i EE eo ak 
=- ee aaia 
用 字 节 表示 的 变量 或 数据 类 | long int y; 
型 大 小 x = sizeof(y); //x = 4 
乘法 Penne. a aa Y fiu lamya Aea 
DEENA TEEPE TI EE 
加 法 加 法 y=a+2; 
-o |as ya 
a z =5 << 2; // z = 0b00010100 
= x =9 >> 3; // x = 0b00000001 
a. eee ree 
a TT. | aD Bd 
y < 12 
z < 2 


大 于 或 等 于 ipa 
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( 续 ) 


类 别 描述 示例 
pat A Boy 


逐 位 AND y =aé15; 


Binion 逐 位 XOR y i OSE 


Logical 


aA." y =x ? a : b; // WẸ x TRUE, y=a, 
Ternary 2 : = s 


+= | m v tv =v +3 
rd aba REBRO io aon o opada f aon a0 r Miaa EO 
ama MARA ee e k areak egaa 
y /= 10; My = y/10 
Assignment 3= | BRE | x%= 4; //x =x 4 
e= | ZESBHRE | ve = 15; Wy = vars 
i= | -还 位 或 移 并 同 舍 |xI-y/x-xly 
^= | 过 位 XOR 移 并 里 值 | x^= vi x = xy 


一 元 运算 符 只 有 一 个 操作 数 。 三 元 运算 符 有 3 个 操作 数 ， 其 他 所 有 运算 符 有 两 个 操作 数 。 
三 元 操作 符 ( 来 自 拉 丁 语 ternarius， 意 指 由 3 个 组 成 ) 选 择 第 二 或 第 三 个 操作 数 取 决 于 第 一 个 操 
作 数 的 值 为 TRUE( 非 零 ) 或 FALSE( 零 )。C 代码 示例 C. 6 说 明 如 何 使 用 三 元 运算 符 计 算 y = 
max (ayb) ， 该 示例 同时 展示 了 等 效 但 更 见长 的 if/else 语句 。 
C 代码 示例 C. 6 (a) 三 元 运算 符 ，(b) 等 效 的 if/else 语句 


(a) y=(a>b)?a:b; // parentheses not necessary, but makes it clearer 


(b) if (a>b) y=a:; 
else y=b; 


简单 赋值 使 用 = 运算 符 。C 代码 也 允许 复合 赋值 ， 即 在 简单 的 运算 后 赋值 ， 例 如 在 加 法 后 
赋值 ( += ) 或 在 乘法 后 赋值 (* = )。 在 复合 赋值 中 ， 左 侧 的 变量 既 参 与 运算 也 被 赋值 运算 结 
果 。C 代码 示例 C.7 显示 了 这 些 和 其 他 C 语言 运算 。 注 释 中 的 二 进 制 值 带 有 前 级 “0b”。 


C 代码 示例 C. 7 ”运算 符 示例 


RER | EaR 备注 


44/14 


mir 


运算 结果 
3 
2 
1 
1 
Ox2C ^0xE //0b101100 ^ 0b1110 


Ox2C && 0xE //0b101100 && 0b1110 逻辑 与 
Ox2C ||0xE //0b101100 ||0b1110 | [eee 逻辑 或 
0x2C &0xE //0b101100 & 0b1130 位 与 
0x2C 10xE //0b101100 |0b1110 位 或 
位 异 或 
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( 续 ) 


RER 备注 


OxE <<2 //0b1110 << 2 0x38 (0b111000) 左 移 2 
0x2C >> 3 //0b101100 >> 3 0x5 (0b101) 右 移 3 
x = 14; 

1 x=16 
x += 2; 


y = 0x2C; // y = 0b101100 
y=0xC (0b001100) 

y &= OxF; // y &=0bl1111 

x = 14; = 44; 

r i pues 在 使 用 x 后 将 其 递增 

Y=y + x+4; 

x = 14; y = 44; l 
x=15, y=59 在 使 用 x 前 将 其 递增 

yy Ez 


C.6 maa A 


模块 化 是 良好 编程 风格 的 关键 。 一 个 大 程序 划分 为 较 小 的 部 分 ， 称 为 函数 ， 类 似 于 硬件 模 
块 ， 有 明确 定义 的 输入 、 输 出 和 行为 。C 代码 示例 C. 8 演示 了 sum3 函数 。 函 数 声明 从 函数 返 
回 类 型 int 开始 ， 紧 跟着 函数 名 sum3 ， 包 含 在 圆 括号 中 的 输入 (int a, int b, int c)。 大 
括号 {} 括 起 来 的 是 郴 数 体 ， 它 可 以 包含 零 条 或 多 条 语句 。return 语句 表明 函数 应 该 返回 给 调 
用 者 的 值 ， 这 可 以 看 作 函 数 的 输出 。 一 个 函数 只 能 返回 一 个 值 。 


C 代码 示例 C.8 sum3 函数 


// Return the sum of the three input variables 
int sum3(int a, int b, intc) I 

int result=a+b+c; 

return result; 
} 


下 面 调用 sum3 Ja, y 保存 值 42。 
int y = sum3(10, 15, 17); 


尽管 一 个 函数 可 以 有 输入 和 输出 ， 也 都 不 是 必需 的 。C 代码 示例 C. 9 展示 了 没有 输入 或 输 
出 的 函数 。 函 数 名 前 面 的 关键 字 void 表示 没有 返回 值 。 括 号 之 间 的 void 表示 该 函数 没有 输 
人 参数 。 


C 代码 示例 C. 9 无 输入 或 输出 的 printPrompt 函数 


// Print a prompt to the console 
void printPrompt( void) 
{ 
printf("Please enter a number from 1-3:\n"); 
} 


在 函数 被 调用 前 ， 函 数 必须 在 代码 中 声明 。 这 个 可 以 通过 将 被 调用 函数 放 在 文件 中 较 前 面 
的 地 方 来 实现 。 为 此 ，main 函数 通常 放 在 C 文件 的 尾部 ,在 它 调用 的 所 有 函数 的 后 面 。 或 者 ， 
在 函数 定义 前 将 函数 原型 放 在 函数 中 。 函 数 原型 是 函数 的 第 一 行 ， 声 明 返 回 类 型 PRR A BA 
数 输入 。 例 如 ，C 代码 示例 C.8 和 C. 9 中 的 函数 的 函数 原型 是 : 


int sum3(int a, int b, intc); 
void printPrompt( void); 
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C 代码 示例 C. 10 说 明 如 何 使 用 也 数 原型 。 即 使 隐 数 本 身 在 main 的 后 面 ， 但 在 文件 顶部 
的 函数 原型 允许 它们 在 main 中 使 用 。 


C 代码 示例 C. 10 ”函数 原型 


#include <stdio.h> 


// function prototypes 
int sum3(int a, int b, intc); 
void printPrompt(void); 


int main(void) 
{ 
int y= sum3(10, 15, 20); 


printf(*sum3 result: d\n", y); 
printPrompt(); 
| 


int sum3(int a, int b, int c) { 
int result = a+bt+c; 
return result; 

) 


void printPrompt(void) { 
printf("Please enter a number from1-3:\n"); 
} 


控制 台 输 出 


sum3 result: 45 
Please enter a number from1-3: 


main AŽ A te SAA Ak el—7 int 值 ， 它 通知 操作 系统 终止 程序 。0 表示 正常 完成 ， 而 
一 个 非 零 值 则 表示 错误 状态 。 如 果 main 晒 数 到 结尾 没有 遇 到 return 语句 ， 它 会 自动 返回 0。 
大 多 数 操 作 系 统 不 会 自动 通知 用 户 程序 返回 的 值 。 


C.7 控制 流 语 铝 


C 提供 条 件 和 循环 的 控制 流 语句 。 条 件 语 句 只 有 在 满足 条 件 的 情况 下 执行 。 循 环 语句 只 要 
满足 条 件 就 重复 执行 。 


C.7.1 条 件 语句 


if、if/else 和 switch/case 语句 是 包括 C 在 内 的 高 级 编程 语言 常用 的 条 件 语句 。 
if 语句 
当 括 号 内 的 表达 式 为 TRUE( 即 非 零 ) 时 ，if 语句 执行 紧 随 其 后 的 语句 。 一 般 格式 为 


if (expression) 
statement 


C 代码 示例 C. 11 显示 了 如 何在 C 中 使 用 if 语句 。 当 变量 aintBroke 等 于 1 时， 变量 
dontFix 设置 为 1。 多 条 语句 的 模块 可 以 通过 用 大 括号 {} 括 起 来 执行 ， 如 C 代码 示例 C. 12 
所 示 。 


C 代码 示例 C. 11 if 语句 


int dontFix= 0; 


if (aintBroke == 1) 
dontFix=1; 
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C 代码 示例 C. 12 含有 代码 块 的 if aA 


// If amt >= $2, prompt user and dispense candy 
if (amt >= 2) | 

printf("Select candy.\n"); 

dispenseCandy =1; 
} 


if/else 语句 


if/else 语句 根据 条 件 执行 两 个 语句 中 的 一 个 ， 如 下 面 的 代码 所 示 。 当 if 语句 中 的 ex- 
pression 是 TRUE 时 ,执行 statement1, Ail, 执行 statement2。 


if (expression) 
statementl 

else 
statement2 


C 代码 示例 C. 6(b) 给 出 了 一 个 C 语言 的 if/else 语句 。 如 果 a 大 于 b 该 代码 设置 max 
等 于 a; 否则 max =b。 


switch/case 语句 
根据 条 件 switch/case 语句 执行 多 条 语句 中 的 一 条 ， 一 般 格 式 为 


Switch (variable) 1 
case (expressionl): statementl break; 
case (expression2): statement2 break; 
case (expression3): statement3 break; 
default: statement4 

} 


例如 ， 如 果 variable 等 于 expression2， 则 继续 执行 statement2 直到 到 达 关 键 字 
break， 此 时 退出 switch/case 语句 。 如 果 没 有 条 件 满足 ， 则 执行 default 条 件 语句 。 

如 果 去 除 关 键 字 break， 则 程序 从 条 件 为 TRUE 的 地 方 开 始 执行 ， 然 后 往 下 执行 它 后 面 剩 
余 的 条 件 语 句 。 这 通常 不 是 你 想 要 的 ， 这 是 新 的 C 程序 员 的 一 个 常见 错误 。 

C 代码 示例 C. 13 展示 switch/case 语句 ， 根 据 变量 option， 确 定 发 放 货 币 amt 的 数 
量 。switch/case 语句 相当 于 一 系列 舱 套 的 if /else Waj, W C 代码 示例 C. 14 所 示 的 等 效 
代码 。 


C 代码 示例 C. 13 switch/case 语句 


// Assign amt depending on the value of option 
switch (option) { 

case 1: amt= 100; break; 

case 2: amt=50; break; 

case 3: amt=20; break; 

case 4: amt=10; break; 

default: printf("Error: unknown option.\n"); 


C 代码 示例 C. 14 BREH if/else 语句 


// Assign amt depending on the value of option 
if (option=1) amt = 100; 

else if (option == 2) amt = 50; 

else if (option == 3) amt = 20; 

else if (option==4) amt= 10; 

else printf("Error: unknown option.\n"); 
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C.7.2 循环 


while.do/while 和 for 循环 是 包括 C 在 内 的 很 多 高 级 编程 语言 常用 的 循环 结构 。 只 要 
条 件 满足 ， 这 些 循环 就 会 重复 执行 某 条 语句 。 


while 循环 
while 循环 重复 执行 一 条 语句 直到 执行 条 件 不 满足 ， 一般 格式 为 


while (condition) 
statement 


C 代码 示例 C. 15 中 的 while 循环 计算 9 的 阶乘 =9 x8 x7 x... x1。 注 意 执行 statement 
前 检查 条 件 是 否 满 足 。 在 这 个 例子 中 ， 该 语句 是 一 个 复合 语句 或 块 ， 所 以 大 括号 是 必需 的 。 


C 代码 示例 C. 15 while 循环 


// Compute 9! (the factorial of 9) 

int 7=1, fact = 1; 

// multiply the numbers from 1 to 9 

while (i < 10) { // while loops check the condition first 
fact *=i; 
i++; 

} 


do/while 循环 


do/while 循环 与 while 循环 类 似 ， 但 在 执行 statement 一 次 后 才 检 查 condition 是 
否 满足 。 一 般 格 式 如 下 所 示 。 condition 之 后 是 分 号 。 


do 
statement 
while (condition); 


C 代码 示例 C. 16 中 的 do/while 循环 让 用 户 猜 一 个 数字 。 只 有 在 do/while JAAN hi 
体 执行 一 次 后 程序 才 检 查 条 件 ( 用 户 的 数字 是 否 等 于 正确 的 数字 )。 当 某 些 语句 必须 在 条 件 检 
查 前 完成 时 ， 这 个 结构 是 有 用 的 ， 例 如 在 该 情况 下 ， 需 要 先 从 用 户 那 里 检索 相关 的 猜测 。 


C 代码 示例 C. 16 do/while 循环 


// Query user to guess a number and check it against the correct number. 
itdef ine MAXGUESSES 3 
#define CORRECTNUM 7 
int guess, numGuesses = 0; 
do | 
printf("Guess a number between 0 and 9. You have 2d more guesses. \n", 
(MAXGUESSES-numGuesses)); 
scanf("%d", &guess); // read user input 
numGuesses++; 
| while ( (numGuesses < MAXGJESSES) & (guess != CORRECTNUM) ); 
// do loop checks the condition after the first iteration 


if (guess == CORRECTNUM) 
printf("You guessed the correct number! \n"); 


for 循环 


for 循环 与 while 和 do/while 循环 类 似 ， 它 重复 执行 statement 直到 condition 不 满 
足 。 然 而 ，for 循环 添加 了 循环 变量 ， 该 变量 通常 跟踪 循环 执行 的 次 数 。for 循环 的 一 般 格 式 为 
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for (initialization; condition; loop operation) 
statement 
initialization 代码 只 执行 一 次 ， 在 for 循环 开始 之 前 。 在 每 次 循环 迭代 开始 时 对 
condition 进行 测试 。 如 果 condition 不 是 TRUE， 则 循环 退出 。Loop operation 在 每 次 
迭代 的 结尾 执行 。C 代码 示例 C. 17 显示 使 用 for 循环 计算 9 的 阶乘 。 


C 代码 示例 C. 17 for 循环 


// Compute 9! 
int i; // loop variable 
int fact =1; 


for (i=1; 1<10; i++) 
fact *= į; 


C 代码 示例 C. 15 和 C. 16 PAY while Al do/while 循环 分 别 包 含 递 增 和 检查 循环 变量 i 
和 numGuesses 的 代码 ，for 循环 将 这 些 语句 融入 其 格式 中 。for 循环 可 以 等 价 表达 为 如 下 
的 代码 ， 但 并 不 方便 。 
initialization; 
while (condition) { 
Statement 


loop operation; 
} 


小 结 


e 控制 流 语 句 : C 提供 条 件 语 句 和 循环 的 控制 流 语 句 。 
e 条 件 语句 : 当 条 件 为 TRUE 时 条 件 语 句 执行 语句 。5C 包括 以 下 的 条 件 语句 : if 、 if/ 
else 和 switch/case. 


e 循环 循环 重复 执行 一 条 语句 直到 条 件 为 FALSE。C 提供 while.do/while 和 for 循环 。 


C.8 更 多 数据 类 型 

除了 各 种 大 小 的 整数 和 浮 点 数 外 ，C 还 包含 其 他 特殊 的 数据 类 型 ， 包 括 指针 、 数 组 、 字 符 
串 和 结构 。 
这 些 数据 类 型 将 在 本 节 结 合 动态 内 存 分 配 一 起 介绍 。 


C.8.1 指针 


指针 是 一 个 变量 的 地 址 。C 代码 示例 C. 18 显示 了 如 何 使 用 指针 。salaryl 和 salary2 
是 能 够 包含 整数 的 变量 ,而 ptr 是 可 以 包含 该 整数 的 地 址 的 变量 。 编 译 器 将 根据 运行 时 环境 
在 RAM 中 给 这 些 变 量 分 配 任意 内 存 位 置 。 为 了 具体 化 ， 假 设 这 个 程序 是 在 32 位 系统 中 编译 ， 
salaryl 在 地 址 0x70 ~73, salary2 在 地 址 0x74 ~77, ptr 在 0x78 ~7B。 图 C-3 显示 了 内 存 
及 执行 该 程序 后 它 的 内 容 。 
C 代码 示例 C. 18 ”指针 


// Example pointer manipulations 
int salaryl, salary2; // 32-bit numbers 


int *ptr;: // a pointer specifying the address of an int variable 
salaryl = 67500; // salaryl = $67,500 = 0x000107AC 
ptr = &salaryl; // ptr = 0x0070, the address of salaryl 


salary2=*ptr +1000; /* dereference ptr to give the contents of address 70 = $67,500, 
then add $1,000 and set salary2 to $68,500 */ 
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数据 ”变量 名 


Salary2 


salaryl 
1 


salary 1 
1 





内 存 
a) 通过 数值 b) 使 用 小 端 内 存 通过 字 节 显示 的 


图 C-3 C 代码 示例 C. 18 执行 后 的 内 存 内 容 


在 变量 声明 中 ， 变量 名 前 的 星 号 ( * ) 表示 该 变量 是 该 声明 类 型 的 指针 。 在 使 用 指针 变量 
时 ，* 运算 符 间接 引用 一 个 指针 ， 返 回 存 储 在 指针 所 包含 的 内 存 地 址 中 的 值 。& 运算 符 的 发 音 
是 “地 址 ”， 它 生成 的 引用 变量 的 内 存 地 址 。 

当 函 数 需 要 修改 变量 时 ， 指 针 特 别 有 用 而 不 是 只 返回 一 个 值 。 因 为 函数 不 能 直接 修改 它们 
的 输入 ， 所 以 函数 可 以 使 其 输入 为 指针 变量 。 这 就 是 称 为 通过 引用 而 不 是 值 来 传递 输入 变量 ， 
如 前 面 的 例子 所 示 。C 代码 示例 C. 19 给 出 通过 引用 传递 x 的 例子 ， 这 样 quadruple 可 以 直接 
修改 变量 。 


C 代码 示例 C. 19 通过 引用 传递 输入 变量 


// Quadruple the value pointed to bya 
#include <stdio.h> 
void quadruple(int *a) 
{ 
大 日 = *a * 4; 
} 
int main(void) 
{ 
int x=5; 
printf("x before: 4d\n", x); 
quadruple(&x); 
printf("x after: Zd\n", x); 
return 0; 
} 


控制 台 输 出 


x before: 5 
x after: 20 


一 个 指向 地 址 0 的 指针 称 为 空 指针 ， 表 示 该 指针 并 不 实际 指向 有 意义 的 数据 。 在 程序 中 它 
写成 NULL。 
C.8.2 数组 


数组 是 一 组 存储 在 内 存 中 连续 地 址 的 类 似 变量 。 元 素 编号 从 0 ~N -1， 其 中 是 数组 的 大 
小 。C 代码 示例 C. 20 声明 一 个 数组 变量 scores, CAT 3 名 学 生 的 期 末 考 试 成 绩 。 为 3 个 
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long 变量 保留 存储 器 空间 ， 即 3 x4 =12 字 节 。 假 设 数组 scores 的 起 始 地 址 为 0x40。 第 一 元 
素 的 地 址 ( 即 scores [0] ) 是 0X40 ， 第 二 个 元 素 地 址 是 0x44 ， 而 第 三 个 元 素 是 0x48 ， 如 图 C-4 
所 示 。 在 C 语言 中 ， 数 组 变量 ， 这 里 是 scores， 是 指向 第 一 个 元 素 的 指针 。 不 能 超出 数组 范 
围 进行 访问 是 程序 员 的 责任 。C 语言 没有 内 部 边界 检查 ， 因 此 一 个 超出 数组 范围 进行 访问 的 程 
序 可 以 编译 好 ， 但 当 它 运行 时 会 逾越 到 内 存 的 其 他 部 分 。 


C 代码 示例 C. 20 ”数组 声明 


long Scores[3]; // array of three 4-byte numbers 


| scores[2] 


| scores| 1] 


scores[0] 





图 C-4 内 存 中 存储 的 数组 scores 


在 声明 时 数组 的 元 素 可 以 用 大 括号 { } 初 始 化 ,如 C 代码 示例 C. 21 所 示 ， 或 者 在 代码 主 中 
单独 初始 化 ， 如 C 代码 示例 C. 22 所 示 。 数 组 的 每 个 元 素 使 用 括号 [ ] 访 问 。 包 含 数 组 的 内 存 内 
容 显 示 在 图 C-4 中 。 用 大 括号 { } 进 行 数 组 初始 化 只 能 在 声明 时 使 用 ， 不 能 在 声明 后 使 用 。for 
循环 通常 用 于 分 配 和 读 取 数 组 数据 ， 如 C 代码 示例 C. 23 所 示 。 


C 代码 示例 C. 21 使 用 { } 在 声明 时 初始 化 数组 


long scores[3]={93, 81, 97}; // scores[0]=93; scores[1]=81; scores[2]=97; 


C 代码 示例 C. 22 ”使 用 赋值 语句 初始 化 数组 


long Scores[3]; 


scores[0] = 93; 
scores[1]=81; 
scores[2] = 97; 


C 代码 示例 C. 23 ”使 用 for 循环 初始 化 数组 


// User enters 3 student scores into an array 
long scores[3]; 
int i, entered; 


printf("Please enter the student's 3 scores.\n"); 
for (i=0; i<3; i++) { 
printf("Enter a score and press enter.\n"); 
scanf("%d", &entered); 
scores[i] =entered; 
} 
printf("Scores: %d %d %d\n", scores[0], scores[1], scores[2]); 
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当 声 明 一 个 数组 时 ， 长 度 必须 是 和 常量， 这样 编 译 器 可 以 分 配 适 量 的 内 存 。 然 而 ， 当 数组 作 
为 输入 参数 传递 给 函数 时 ， 不 需要 定义 长 度 ， 因 为 该 函数 只 需要 知道 数组 的 起 始 地 址 。C 代码 
示例 C. 24 显示 了 如 何 传递 数组 给 函数 。 输 入 参数 arr 只 是 数组 第 一 个 元 素 的 地 址 。 通 常数 
组 中 的 元 素数 量 也 作为 输入 参数 传递 给 函数 。 在 一 个 函数 中 ， 类 型 为 int [] 的 输入 参数 表明 这 
是 一 个 整数 数组 。 任 何 类 型 的 数组 都 可 以 传递 给 函数 。 


C 代码 示例 C. 24 ”将 数组 作为 输入 参数 传递 


// Initializea5-element array, compute the mean, and print the result. 
fHinclude <stdio.h> 
// Returns the mean value of an array (arr) of length len 
float getMean(int arr[], int len) i 

int i; 

float mean, total =0; 

for (i=0; i < len; i++) 

total += arr[i]; 

mean= total / len; 

return mean; 
} 


int main(void) | 
int data[4] ={78, 14, 99, 27}: 
float avg; 


avg = getMean(data, 4); 


printf("The average value is: %f.\n", avg); 
} 


控制 台 输 出 


The average value is: 54.500000. 


数组 参数 相当 于 一 个 指向 数组 起 始 位 置 的 指针 。 因 此 ，getMean 也 可 以 如 下 声明 


float getMean(int *arr, int len); 


虽然 功能 上 相同 , 但 datatype [] 是 作为 输入 参数 传递 数组 的 首选 方法 ， 因 为 它 更 清楚 地 
表明 该 参数 是 一 个 数组 。 

函数 被 限制 为 单个 输出 ， 即 返回 变量 。 然 而 ,通过 接收 一 个 数组 作为 输入 参数 ， 函 数 实 
质 上 可 以 通过 改变 数组 本 身 输出 多 个 值 。C 代码 示例 C. 25 将 数组 从 最 低 到 最 高 排序 ， 并 把 
排序 结果 存储 在 同一 个 数组 中 。 下 面 3 个 函数 原型 是 等 效 的 。 在 郴 数 声明 中 数组 的 长 度 被 
忽略 。 


void sort(int *vals, int len); 
void sort(int vals[L], int len); 
void sort(int vals[100], int len); 


C 代码 示例 C. 25 ”将 数组 及 其 大 小 作为 输入 传递 


// Sort the elements of the array vals of length len from lowest to highest 
void sort(int vals[], int len) 
{ 

inti, j, temp: 


for (i=0; i<len; i++) { 
for (j=i+l; j<len; j++) { 
if (vals[i] > vals[j]) | 
temp = vals[i]; 
vals[i] =vals[jl]; 
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vals[j] = temp; 
) 


数组 可 以 有 多 维 。C 代码 示例 C. 26 采用 二 维 数组 存储 10 名 学 生 的 8 个 习题 集 的 分 数 。 回 
想 一 下 使 用 { } 进 行 数组 值 初始 化 只 允许 在 声明 时 采用 。 


C 代码 示例 C. 26 ”二 维 数组 初始 化 


// Initialize 2-D array at declaration 

int grades[10][8] = | (100, 107, 99, 101, 100, 104, 109, 117}, 
{103, 101, 94, 101, 102, 106, 105, 110), 
{101, 102, 92, 101, 100, 107, 109, 110), 
{114, 106, 95, 101, 100, 102, 102, 100), 
{98, 105,97, 101, 103, 104, 109, 109), 
{105, 103, 99, 101, 105, 104, 101, 105), 
{103, 101, 100, 101, 108, 105, 109, 100), 
{100, 102, 102, 101, 102, 101, 105, 102), 
1102, 106, 110, 101, 100, 102, 120, 103), 
{99, 107, 98, 101, 109, 104, 110, 108) }; 


C 代码 示例 C. 27 展示 一 些 对 C 代码 示例 C. 26 中 的 二 维 数组 grade 进行 运算 的 函数 。 作 
为 函数 输入 参数 的 多 维 数组 必须 定义 所 有 所 有 维度 ， 除 了 第 一 个 维度 外 。 因 此 ， 下 面 的 两 个 函 
数 原型 都 是 可 接受 的 : 


void print2dArray(int arr[10][8]); 
void print2dArray(int arr[][8]) ; 


C 代码 示例 C. 27 ”多 维 数组 运算 





#Hinclude <stdio.h> 


// Print the contents of a 10x8 array 
void print2dArray(int arr[10][L8]) 
| 

int 1... fs 


for (i=0; 1<10; i++) { // for each of the 10 students 
printf ("Row éd\n", i); 
for (j=0; j<8; j++) { 

printf("%d ", arr[i][j]):; // print scores for all 8 problem sets 

} 
printf("\n"); 

| 

} 


// Calculate the mean score of a 108 array 
float getMean( int arr[10][8]) 
{ 

inti, j; 

float mean, total = 0; 


// get the mean value across a 20 array 
for (i=0; 1<10; i++) | 
for (j=0; j<8; j++) | 
total +=arr[i][j]: // sum array values 
} 
} 
mean = total/(10*8); 
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printf("Mean is: %f\n", mean); 


return mean; 
} 


注意 ， 因 为 数组 由 指向 初始 元 素 的 指针 表示 ， 所 以 C 语言 不 能 使 用 = 或 == 运 算 符 复制 或 
比较 数组 。 必 须 使 用 一 个 循环 来 复制 或 比较 每 个 元 素 ， 一 次 一 个 。 


C.8.3 字符 


字符 (char) 是 一 个 8 位 变量 。 它 可 以 被 看 作 -128 ~ 127 之 间 的 补 码 或 作为 一 个 字母 、 数 
字 或 符号 的 ASCI 码 。ASCII 字符 可 以 指定 为 一 


i i = C-4 ”特殊 字符 
个 数值 ( 十进制 、 十 六 进 制 等 ) 或 作为 用 单 引号 | 
括 起 来 的 可 打印 的 字符 。 例 如 ， 字 母 A 的 ASCII ate 描述 


码 是 0x41，B =0x42 等 。 于 是 'A' +3 是 0x44 或 se a 

'D'。 表 6-2 列 出 了 ASCI 字符 编码 ， 表 C-4 列 6) | 

出 了 用 于 指示 格式 或 特殊 字符 的 字符 。 格 式 化 代 o | oo | 字符 申 结束 
码 包括 回 车 (\ r)、 换 行 符 (\ n)、 水 平 制 表 符 i ee | 
(\t) 和 字符 串 结束 (\0)。\z 用 于 显示 完整 von] | 

性 ,但 在 C 程序 中 很 少 使 用 。\z 返回 输入 指示 | 07 

(输入 的 位 置 ) 到 该 行 的 开始 ( 左 ) ， 但 该 行 的 任 一 于 | om 

何 文字 将 被 覆盖 。 相 反 ，\n 则 移动 输入 位 置 到 新 的 一 行 的 开头 ?。NULL FRC RRX 
本 串 的 结束 ， 将 在 C. 8. 4 节 讨 论 。 


C.8.4 FHE 


字符 串 是 用 来 存储 一 块 有 界 但 可 变 长 度 文本 的 字符 数组 。 每 个 字符 是 代表 该 字母 、 数 字 或 
符号 的 ASCH 码 字 节 。 数 组 的 大 小 确定 字符 串 的 最 大 长 度 ， 但 字符 串 的 实际 长 度 可 以 更 短 。 在 
C 语言 中 ， 通 过 寻找 字符 串 末尾 的 空 终 止 符 (ASCII 值 0x00) 来 确定 字符 串 的 长 度 。 

C 代码 示例 C. 28 显示 了 10 元 素 字符 数组 greeting KWEH, PAARE “Hello!” F 
符 串 。 具 体 地 ， 假 设 greeting 从 内 存 地 址 0x50 处 开始 。 图 C-5 显示 了 从 0x50 到 0x59 的 内 存 
内 容 ， 该 段 内 存 保存 字符 串 “Hellol"。 注 意 该 字符 串 仅 使 用 数组 的 前 7 个 元 素 ， 即 使 在 内 存 
中 分 配 了 10 个 元 素 的 空间 。 


greeting 





内 存 
图 C-5 内存 中 存储 的 字符 串 “Hello!” 


© Windows 文本 文件 使 用 \r \n 来 表示 行 结束 ， 而 基于 UNIX 的 系统 使 用 \n 来 表示 行 结束 ， 这 可 能 将 在 系统 间 
移动 文本 文件 时 造成 讨厌 的 错误 。 
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C 代码 示例 C. 28 字符 串 声 明 


char greeting[10] = "Hello!"; 


C 代码 示例 C. 29 显示 了 字符 串 greeting 的 另 一 种 声明 。 指 针 greeting, 保存 7 元素 
数组 的 第 一 个 元 素 地 址 ， 该 数组 由 “Hello!” 中 的 每 个 字符 和 空 终止 符 组 成 。 该 代码 还 说 明了 
如 何 使 用 % s 格式 代码 来 输出 字符 串 。 


C 代码 示例 C. 29 “ 另 一 种 字符 串 声 明 
char *greeting = "Hello!"; 控制 台 输 出 


printf("greeting: %s", greeting): greeting: Hello! 


不 同 于 基本 变量 ， 字 符 串 不 能 用 等 号 运算 符 = 设置 等 于 另 一 个 字符 串 。 字 符 数 组 中 的 每 个 
元 素 必 须 从 源 字符 串 单独 复制 到 目的 字符 串 。 这 适用 于 任何 数组 。C 代码 示例 C. 30 复制 一 个 
字符 串 src 到 另 一 个 字符 串 dst。 不 需要 给 出 数组 的 大 小 ， 因 为 字符 串 src 的 末尾 是 由 空 终 


止 符 指示 。 但 是 ，dst 必须 足够 大 ， 这 样 就 不 会 逾越 到 其 他 数据 。strcpy 和 其 他 字符 串 处 理 
函数 由 C 语言 内 置 库 ( 见 C.9. 4 节 ) 提 供 。 


C 代码 示例 C. 30 ”字符 串 复 制 


// Copy the source string, src, to the destination string, dst 
void strcpy(char *dst, char *src) 
{ 


int i =0; 
do | 

dst[i] = src[i]; // copy characters one byte at a time 
} while (src[i++]); // until the null terminator is found 


} 


C.8.5 结构 
在 C 中 ， 结 构 是 用 于 存储 各 种 类 型 数据 的 集合 。 结 构 声 明 的 一 般 格式 为 


struct name { 
typel elementl; 
type2 element2; 


+3 t 
其 中 struct 是 一 个 关键 字 ， 指 示 它 是 一 个 结构 ，name 是 结构 标签 名 称 ，element1l1 和 


element2 是 结构 的 成 员 。 结 构 可 以 有 任意 数量 的 成 员 。C 代码 示例 C. 31 展示 了 如 何 使 用 结 
构 来 存储 联系 人 信息 。 然 后 程序 声明 一 个 struct contact 类 型 的 结构 变量 cl 。 


C 代码 示例 C. 31 结构 声明 


struct contact { 

char name[30]; 

int phone; 

float height; // inmeters 
F; 
struct contact cl; 
strcpy(cl.name, "Ben Bitdiddle"); 
cl.phone = 7226993; 
cl.height = 1.82; 
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与 内 置 的 C 数据 类 型 一 样 ， 你 可 以 创建 结构 数组 和 结构 指针 。C 代码 示例 C. 32 创建 联系 
人 数组 。 


C 代码 示例 C. 32 ”结构 数组 


struct contact classlist[200]; 
classlist[0]. phone = 9642025; 


通常 使 用 指向 结构 的 指针 。C 提供 了 成 员 访 问 运 算 符 一 来 间接 引用 指向 结构 指针 并 访问 结 
构 的 成 员 。C 代码 示例 C. 33 显示 了 声明 一 个 指向 struct contact 的 指针 的 例子 ， 使 它 指 问 
C 代码 示例 C. 32 中 的 classlist 的 第 和 2 元素， 并 使 用 成 员 访 问 运 算 符 来 设置 该 元 素 的 值 。 


C 代码 示例 C. 33 ”使 用 指针 和 一 访问 结构 成 员 


struct contact *cptr; 
cptr = &classlist[42]; 
cptr->height=1.9; // equivalent to: (*cptr). height =1.9; 


可 以 通过 值 或 引用 将 结构 作为 函数 输入 或 输出 传递 。 按 值 传递 需要 编译 器 将 整个 结构 复制 
到 内 存 中 以 便 函 数 访问 。 对 于 大 结构 ， 这 可 能 需要 大 量 的 内 存 和 时 间 。 通 过 引用 传递 包括 传递 
一 个 结构 指针 ， 这 更 有 效 。 郴 数 还 可 以 修改 被 指向 的 结构 ， 而 不 必 返 回 另 一 个 结构 。C 代码 示 
例 C. 34 显示 了 两 个 版 本 的 stretch 函数 ,使 contact 增高 2 厘米 。stretchByReference 
避免 两 次 复制 大 的 结构 。 


C 代码 示例 C. 34 ”通过 值 或 名 称 传递 结构 


struct contact stretchByValue(struct contact c) 
{ 
c. height += 0.02; 
return c; 
| 
void stretchByReference(struct contact *cptr) 
| 
cptr->height += 0.02; 
} 


int main(void) 
{ 
struct contact George; 


George. height = 1.4; // poor fellow has been stooped over 

George = stretchByValue(George); // stretch for the stars 

stretchByReference(&George) ; // and stretch some more 
} 


C.8.6 * typedef 


C 也 允许 你 使 用 typedef 语句 定义 自己 的 数据 类 型 名 称 。 例 如 ， 当 struct contact 经 
常会 用 到 时 ， 写 struct contact 将 变 得 繁琐 ， 所 以 可 以 定义 一 个 新 类 型 名 称 contact 并 使 
HE, W C 代码 示例 C. 35 所 示 。 


C 代码 示例 C. 35 (A typedef 创建 自 定 义 的 类 型 


typedef struct contact | 
char name[30]); 
int phone; 
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float height; // in meters 
} contact; // defines contact as shorthand for "struct contact" 


contact cl; // now we can declare the variable as type contact 


typedef 可 用 于 创建 新 的 类 型 ASH be AEA A H E Bde fi a Ze Bo C 代码 
示例 C. 36 定义 byte Fl bool 为 8 位 类 型 。byte 类 型 可 以 更 清楚 地 表明 pos 的 目的 是 成 为 一 
个 8 位 数字 ， 而 不 是 一 个 ASCI FIF, bool 类 型 表示 该 8 位 数 表 示 TRUE 或 FALSE。 这 些 类 型 
使 程序 比 到 处 使 用 char 类 型 更 易于 阅读 。 


C 代码 示例 C. 36 typedef byte M bool 类 型 


typedef unsigned char byte; 
typedef char bool; 

#define TRUE 1 

#define FALSE 0 


byte pos = 0x45; 
bool loveC = TRUE; 


C 代码 示例 C. 37 阐述 使 用 数组 定义 3 元 素 vector 和 3 x3matrix 类 型 。 
C 代码 示例 C. 37 typedef vector M matrix 类 型 


typedef double vector[3]; 
typedef double matrix([3](3]; 


vector a= {4.5, 2.3, 7.0}; 
matrix b={(3.3, 4.7.9.2), (2.5. 4, 9b. (3.1, 99.2. 88)}; 


C.8.7 * 动态 内 存 分 配 


到 现在 为 止 ， 所 有 例子 中 的 变量 都 声明 为 静态 的 。 也 就 是 说 ， 它 们 的 大 小 在 编译 时 是 已 
知 的 。 这 对 于 可 变 大 小 的 数组 和 字符 串 可 能 会 有 问题 ， 因 为 数组 必须 声明 足够 大 以 便 容纳 
程序 永远 不 会 看 到 的 最 大 容量 。 替 代 方 法 是 当 实 际 大 小 已 知 时 ， 在 运行 时 动态 地 分 配 内 存 
空间 。 

stdlib. h 中 的 malloc 函数 分 配 指 定 大 小 的 内 存 块 并 返回 一 个 指向 它 的 指针 。 如 果 没 有 
足够 的 可 用 内 存 ， 它 返回 一 个 空 指针 。 例 如 ， 下 面 的 代码 分 配 10 个 短 整数 类 型 (10 x2 = 20 F 
三 )。Sizeof 运算 符 返 回 类 型 或 变量 的 字 节 大 小 。 

// dynamically allocate 20 bytes of memory 

short *data = malloc(10*sizeof(short)); 

C 代码 示例 C. 38 说 明了 动态 分 配 和 解除 分 配 。 程 序 接受 可 变数 量 的 输入 ， 将 其 存储 在 动 
态 分 配 的 数组 中 ， 并 计算 其 平均 值 。 所 需 的 内 存 容量 取决 于 数组 的 元 素 的 数目 和 每 个 元 素 的 大 
小 。 例 如 ， 如 果 一 个 int 是 一 个 4 字 节 变量 ， 且 需要 10 个 元 素 ， 那 么 动态 分 配 40 字 节 。 
free 图 数 将 释放 分 配 的 内 存 ， 这 样 它 可 以 在 以 后 用 于 其 他 用 途 。 不 能 动态 释放 分 配 的 数据 称 
为 内 存 泄漏 ， 应 该 避免 内 存 泄漏 。 


C 代码 示例 C. 38 动态 内 存 分 配 和 释放 内 存 


// Dynamically allocate and de-allocate an array using malloc and free 
#include <stdlib.h> 


// Insert getMean function from C Code Example C. 24. 


422 附录 C 


int main(void) 1 
int len, i; 


int *nums; 


printf( "How many numbers would you like to enter? "a 
scanf("%d", &len); 
nums = malloc(len*sizeof(int)); 
if (nums == NULL) printf("ERROR: out of memory.\n"); 
else | 
for (i=0; i<len; i++) 1 
printf("Enter number: ye 
scanf("%d", &nums[i]); 
} 
printf("The average is f\n", getMean(nums, len)); 
| 
free(nums); 


C.8.8 = 链表 


链表 是 用 于 存储 可 变数 量 元 素 的 常见 数据 结构 。 链 表 中 的 每 个 元 素 包含 一 个 或 多 个 数据 字 
段 和 一 个 到 下 一 个 元 素 的 链接 。 链 表 中 的 第 一 个 元 素 称 为 头 。 链 表 可 用 于 说 明 许 多 结构 、 指 针 
和 动态 内 存 分 配 的 概念 。 

C 代码 示例 C. 39 描述 用 于 存储 计算 机 用 户 账 户 的 链表 ， 以 容纳 可 变数 目的 用 户 。 每 个 
用 户 都 有 一 个 用 户 名 、 一 个 口令 、 一 个 唯一 的 用 户 识 别 码 (UID ) 和 一 个 指示 他 们 是 否 具 有 管 
理 员 权限 的 字段 。 链 表 的 每 个 元 素 的 类 型 为 userL， 包 含 此 用 户 的 所 有 信息 和 链表 中 下 一 
个 元 素 的 链接 。 链 表 头 指针 存储 在 一 个 名 为 user 的 全 局 变量 中 ， 初 始 值 为 NULL， 表 示 没 
有 用 户 。 

该 程序 定义 函数 插入 、 删 除 、 查 找 用 户 和 计算 用 户 数 。insertUser 函数 为 新 的 链表 元 
素 分 配 空 间 ， 并 将 其 添加 到 列表 头 。deleteUser 函数 扫描 列表 直至 找到 指定 的 UID， 然 后 
删除 该 元 素 ， 调 整 前 一 个 元 素 的 链接 以 便 跳 过 被 删除 的 元 素 ， 并 释放 被 删除 元 素 所 占用 的 
内 存 空间 。findUser 函数 扫描 列表 直至 找到 指定 的 UID 并 返回 一 个 指向 该 元 素 的 指针 ， 或 
NULL 如 果 没 有 找到 该 UID。numUsers 函数 计算 列表 中 元 素 的 数量 。 


C 代码 示例 C. 39 ”链表 


#include <stdlib.h> 
#include <string.h> 


typedef struct userl 1 


char uname[80]; // user name 
char passwd[80]; // password 
int uid; // user identification number 
int admin; // 1 indicates administrator privileges 
struct userL *next; 
} userL; 


userLl *users = NULL; 


void insertUser(char *uname, char *passwd, int uid, int admin) { 
userL *newUser; 


newUser =malloc(sizeof(userL)); // create space for new user 
strcepy(newUser->uname, uname); // copy values into user fields 
strcpy(newUser->passwd, passwd); 

newUser->uid = uid; 
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newUser->admin = admin; 
newUser-next = users; // insert at start of linked list 
users = newUser; 

] 


void deleteUser(int uid) { // delete first user with given uid 
userL *cur = users; 
userL *prev = NULL; 


while (cur !=NULL) { 
if (cur->uid ==uid) { // found the user to delete 
if (prev == NULL) users = cur~>next; 
else prev->next = cur->next; 
free(cur); 
return; // done 
} 
prev = cur; // otherwise, keep scanning through list 
cur = Cur->next; 
} 
} 


userL *findUser(int uid) { 
USerL *cur = users; 


while (cur !=NULL) { 
if (cur->uid ==uid) return cur; 
else cur = cur->next; 
} 
return NULL; 
| 


int numUsers(void) 1 
USerL *cur = users; 
int count =0; 


while (cur != NULL) { 
count++; 
cur = cur->next; 
} 
return count; 
} 


小 结 


。 指针 : 指针 保存 变量 的 地 址 。 

© 数组 : 数组 是 使 用 方 括号 [ ] 声 明 的 相似 元 素 的 列表 。 

© 字符 : char 类 型 可 容纳 小 整数 或 表示 文本 或 符号 的 特殊 代码 。 

© 字符 串 : 一 个 字符 串 是 以 空 终止 符 0x00 结束 的 字符 数组 。 

。 结构 : 一 个 结构 存储 相关 变量 的 集合 。 

e 动态 内 存 分 配 : malloc 是 在 程序 运行 时 分 配 内 存 的 内 置 函数 。free 使 用 后 释放 分 配 
的 内 存 。 

。 链表 : 链表 是 一 种 常见 的 数据 结构 ， 用 于 存储 可 变数 量 的 元 素 。 


C.9 标准 库 
程序 员 通 常 使 用 多 种 标准 函数 ， 如 输出 和 三 角 运 算 。 为 了 使 程序 员 不 必 从 头 编写 这 些 耳 


数 ，C 提供 了 第 用 的 函数 库 。 每 个 库 都 有 一 个 头 文件 和 相关 联 的 目标 文件 ， 这 是 部 分 编译 的 C 
文件 。 头 文件 包含 变量 声明 、 已 定义 的 类 型 和 函数 原型 。 目 标 文 件 包含 函 数 本 身 ， 它 们 在 编译 
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时 被 链接 以 便 创 建 可 执行 文件 。 由 于 库 函 数 调用 已 经 被 编译 成 的 目标 文件 ， 所 以 缩短 了 编译 时 
间 。 表 C-5 列 出 了 一 些 最 常用 的 C 函数 库 ， 下 面 将 简要 描述 每 个 函数 。 
表 C-5 常用 的 C ARE 
C 函数 库 头 文件 描述 
标准 输入 /输出 库 。 包 括 向 屏幕 或 文件 输出 或 从 屏幕 或 文件 读 的 函数 (printf, fprintf 和 


下 scanf、fscanf)， 以 及 打开 和 关闭 文件 的 函数 ( fopen 和 fclose) 
avis 标准 库 。 包 括 随机 数 生 成 函数 (rand 和 srand), MAS4 BC AREA A FE (malloc 和 
PEE free) 、 提 前 终止 程序 函数 (exit) ， 以 及 字符 串 和 数字 之 间 的 转换 函数 (atoi 、atol 和 atof) 
数学 库 。 包 括 标准 数学 函数 ,如 sin, cos, asin, acos, sqrt, log, logl0, exp, 
math.h f 
floor 和 ceil 
string.h 字符 串 库 。 包 括 比 较 ,复制 连接 和 确定 字符 串 长 度 等 函数 


C.9.1 stdio 


标准 输入 /输出 库 stdio .h 包含 输出 到 控制 台 、 读 取 键 盘 输 入 、 读 取 和 写 人 文件 的 命令 。 
为 了 使 用 这 些 消 数 ， 该 库 必须 包含 在 C 文件 的 表 C-6 输出 变量 的 printf 格式 化 代码 


顶部 : 代码 格式 
#include <stdio.h> $d 十 进 制 
$x 十 六 进 制 


输出 格式 语句 printf 在 控制 台 上 显示 文 八进制 
本 。 其 所 需 的 输入 参数 是 用 引号 "" 括 起 来 的 字 a 


符 串 。 该 字符 串 包含 文 本 和 可 选 命令 以 便 输出 变 n 使 用 科学 计数 法 表示 ， 如 1. 56e7 
量 。 要 输出 的 变量 列 在 字符 串 的 后 面 ， 并 采用 (float 或 double) 

K C-6 所 示 的 格式 代码 输出 。C 代码 示例 C. 40 = eat chee) 

给 出 一 个 printf 的 简单 例子 。 ts 字符 串 ( 采 用 空 终止 符 的 字符 数组 ) 


C 代码 示例 C. 40 ”使 用 printf 在 控制 台 上 输出 


// Simple print function 
#include <stdio.h> 


int num = 42; 
int main(void) | 


printf( "The answer is d.\n", num); 
} 


控制 台 输 出 


The answer is 42. 


浮 点 数 格式 (floats 和 doubles) 默认 为 在 小 数 点 后 输出 6 位 数字 。 要 改变 的 精度 ， 
以 % w. df RRD f， 其 中 w 是 数字 的 最 小 宽度 ， 而 d 是 要 输出 的 小 数位 数 。 注 意 ， 小 数 点 包 
括 在 宽度 计数 中 。 在 C 代码 示例 C.41 中 ，pi 由 4 个 字符 输出 ， 其 中 2 个 在 小 数 点 后 : 3. 14。 
e 由 8 个 字符 输出 ， 其 中 3 个 在 小 数 点 后 。 因 为 它 在 小 数 点 前 只 有 1 位 数字 ， 所 以 它 被 填充 了 
3 个 高 位 空间 以 达到 所 要 求 的 宽度 。c 应 由 5 个 字符 输出 ， 其 中 3 个 在 小 数 点 后 。 但 它 太 宽 而 
难以 适合 所 需 的 数字 宽度 ， 所 以 在 保留 小 数 点 后 3 位 的 情况 下 覆 写 所 需 的 宽度 。 
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C 代码 示例 C. 41 用 于 输出 的 浮 点 数 格式 


// Print floating point numbers with different formats 
float pi = 3.14159, e= 2.7182, c=2.998e8; 
printf("pi = 24.2f\ne =%28.3f\nc =%5.3f\n", pi, e, c); 


c = 299800000.000 


由 于 % 和 \ 用 于 输出 格式 化 ， 所 以 为 了 输出 这 些 字符 本 身 ， 必 须 使 用 C 语言 代码 示例 C. 42 
所 示 的 特殊 字符 序列 。 


C 代码 示例 C. 42 使 用 printf 输出 % M\ 


// How to print % and \ to the console 
printf("Here are some special characters: 4% \\ \n"); 


控制 台 输 出 


Here are some Special characters: 2 \ 


scanf 


scanf KAMERAER AE, CERS printf 相同 的 格式 代码 。C 代码 示例 
C. 43 展示 了 如 何 使 用 scant RM, “IRF scant AAt, 程序 等 待 直到 用 户 键 人 一 个 值 才 继 
续 执行 。scanf 的 参数 是 一 个 字符 串 ， 表 示 一 个 或 多 个 格式 代码 ， 以 及 指向 存储 结果 的 变量 
的 指针 。 


C 代码 示例 C. 43 ”使 用 scanf 从 键盘 读 取 用 户 输入 


// Read variables from the command line 
#include <stdio.h> 


int main(void) 
{ 
int a; 
char str[80]; 
float f: 


printf(“Enter an integer.\n"); 

scanf("%d", ka); 

printf("Enter a floating point number.\n"); 

scanf("Zf", &f); 

printf("Enter a string.\n"); 

scanf("%s", str); // note no & needed: str is a pointer 


文件 操作 

许多 程序 需要 读 取 和 写 人 文件 ， 或 者 处 理 已 经 存储 在 文件 中 的 数据 或 者 记录 大 量 的 信息 。 
在 C 语言 中 ， 文 件 必须 先 用 fopen 函数 打开 。 然 后 ， 它 可 以 被 fscanf 或 fprintf 函数 读 取 
或 写 人 ， 其 方式 类 似 于 读 取 和 写 人 控制 台 。 最 后 ， 应 该 用 fclose 函数 关闭 文件 。 

fopen 函数 将 文件 名 和 输出 模式 作为 参数 。 它 返回 一 个 FILE* 类 型 的 文件 指针 。 如 果 
fopen 无 法 打开 文件 ， 它 返回 NULL。 这 种 情况 可 能 是 试图 读 取 一 个 不 存在 的 文件 或 试图 写 人 
一 个 已 由 另 一 个 程序 打开 的 文件 。 模 式 包 括 : 

e “w: 写 人 文件。 如 果 该 文件 存在 ， 它 将 被 覆 写 。 
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e “r”, 读 取 文件 。 

e “a”: 添加 到 现 有 文件 的 末端 。 如 果 该 文件 不 存在 ， 则 创建 它 。 

C 代码 示例 C. 44 显示 了 如 何 打 开 、 输 出 和 关闭 文件 。 总 是 检查 文件 是 否 被 成 功 打 开 是 很 
好 的 做 法 ， 如 果 没 有 成 功 打 开 文 件 则 提供 一 个 错误 信息 。exit 函数 将 在 C.9.2.2 节 讨 论 。 
fprintf 函数 与 printf RW, 但 它 还 将 文件 指针 作为 输入 参数 ， 以 便 知道 写 哪 个 文件 。 
fclose 因数 关闭 文件 ， 确 保 所 有 的 信息 实际 上 写 人 磁盘 并 释放 文件 系统 资源 。 


C 代码 示例 C. 44 ”使 用 fprintf 输出 到 文件 


// Write "Testing file write." to result.txt 
#include <stdio.h> > 
#include <stdlib.h> 


int main(void) | 
FILE *fptr; 


if ((fptr = fopen("result.txt", "w")) == NULL) { 
printf("*Unable to open result.txt for writing.\n"); 
exit(1); // exit the program indicating unsuccessful execution 
} 
fprintf(fptr, "Testing file write.\n"); 
fclose(fptr); 
} 


C 代码 示例 C. 45 说 明了 从 一 个 名 为 data. txt 的 文件 使 用 fscanf 读 取 数字 。 该 文件 必须 先 
打开 再 读 。 该 程序 然后 使 用 feof 函数 检查 是 否 已 到 达 文 件 的 末尾 。 只 要 程序 未 到 达 末 尾 ， 它 
读 取 下 一 个 数字 并 将 其 输出 在 屏幕 上 上。 同样 ， 该 程序 在 结束 时 关闭 该 文件 以 便 释 放 资 源 。 


C 代码 示例 C. 45 ”使 用 fscanf 从 文件 读 取 输入 


#include <stdio.h> 


int main(void) 
{ 
FILE *fptr; 
int data; 


// read in data from input file 
if ((fptr = fopen("data.txt", "r")) == NULL) { 
printf("Unable to read data.txt\n"); 
exit(1); 
} 
while (!feof(fptr)) { // check that the end of the file hasn't been reached 
fscanf(fptr, "Zd", &data); 
printf("Read data: d\n", data); 
} 


fclose(fptr); 
} 
data. txt 
25 32 14 89 


控制 台 输出 


Read data: 25 
Read data: 32 
Read data: 14 
Read data: 89 


其 他 便利 的 stdio FAR 
sprintf 函数 将 字符 输出 为 字符 串 ，sscanf 从 字符 串 读 取 变 量 。fgetc 函数 从 文件 中 
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读 取 一 个 字符 ， 而 fgets 则 将 一 整 行 读 入 一 个 字符 串 。 
fscanf 读 取 和 解析 复杂 文件 的 能 力 相 当 有 限 ， 所 以 通常 使 用 fgets 一 次 读 取 一 行 数 据 ， 
然后 使 用 sscanf 整理 该 行 ， 或 使 用 fgetc 循环 检查 每 个 字符 。 


C.9.2 stdlib 


标准 库 stdlib.h 中 提供 通用 函数 ， 包 括 随机 数 生成 (rand 和 srand)、 动 态 内 存 分 配 
(malloc 和 free， 已 经 在 C. 8. 8 节 讨 论 过 )、 提 前 终止 程序 (exit) 和 数字 格式 转换 。 要 使 用 
HE PR, TE C 文件 的 顶部 添加 以 下 行 。 

#include <stdlib.h> 


rand 和 srand 


rand 返回 一 个 伪 随 机 整数 。 伪 随机 数 有 随机 数 的 统计 信息 ， 但 遵循 一 个 由 称 为 种 子 的 初 
始 值 开 始 的 确定 性 模式 。 为 了 将 数字 转换 到 特定 的 范围 ， 使 用 C 代码 示例 C. 46 所 示 的 模 运 算 
IFCS ) 将 其 范围 确定 为 0~9。x 和 y 的 值 是 随机 的 ,但 它们 在 程序 每 次 运行 时 都 是 相同 的 。 
控制 台 输 出 示例 见 下 面 的 代码 。 

C 代码 示例 C. 46 ”使 用 rand 生成 随机 数 
#include <stdlib.h> 


x=rand(); //x=a random integer 
y=rand() 410; // y=a random number from 0 to 9 
printf(“x=4d, y=%d\n", x, y); 


控制 台 输 出 


x = 1481765933, y = 3 


每 次 程序 运行 时 通过 改变 种 子 程序 员 创 建 不 同 的 随机 数 序列 。 这 是 通过 调用 srand 函数 
来 实现 的 ， 它 以 种 子 作 为 其 输入 参数 。 如 C 代码 示例 C. 47 Bras, 种子 本 身 必须 是 随机 的 ， 所 
以 典型 的 C 程序 通过 调用 time 函数 、 返 回 当前 以 秒 为 单位 的 时 间 来 给 该 种 子 赋值 。 


C 代码 示例 C. 47 使 用 srand 来 设置 随机 数 生成 器 的 种 子 


// Produce a different random number each run 
#include <stdlib.h> 
include <time.h> // needed to call time() 


int main(void) 

{ 
int x; 
srand(time(NULL)); // seed the random number generator 
x=rand() % 10; // random number from 0 to 9 
printf("x=2d\n", x); 


exit 

exit 函数 提前 终止 程序 。 它 将 返回 的 参数 提交 给 操作 系统 ， 表 明 终 止 的 原因 。0 表示 正 
常 完成 ， 而 非 零 则 提交 错误 的 条 件 。 

格式 转换 : atoi、atol、atof 


标准 库 提 供 atoi atol 和 atof Raa ASCH 字符 串 转换 为 整数 、 长 整数 或 者 双 精 
度 浮 点 数 ， 如 C 代码 示例 C. 48 所 示 。 在 从 一 个 文件 读 取 混 合 数据 (字符 串 和 数字 组 合 ) 或 处 理 
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数字 命令 行 参数 时 ， 这 特别 有 用 ， 如 C. 10.3 市 所 述 。 
C 代码 示例 C. 48 ”格式 转换 


// Convert ASCII strings to ints, longs, and floats 
#include <stdlib.h> 


int main(void) 
{ 
int x; 
long int y; 
double z; 


x =atoi("42"); 
y = atol("833"); 
z= atof("3.822"); 


printf("x = %d\ty =Zd\tz =%f\n", x, y. Z); 


| 
控制 台 输 出 
X=42 y=833 z=3.822000 


C.9.3 math 


数学 库 math .h 提供 常用 的 数学 函数 ， 如 三 角 函 数 、 平 方 根 和 对 数 。C 代码 示例 C.49 展 
示 了 如 何 使 用 其 中 的 一 些 函数 。 要 使 用 数学 函数 ,在 C 文件 中 放置 以 下 行 : 


#include <math.h> 


C 代码 示例 C. 49 ”数学 函数 


// Example math functions 
#include <stdio.h> 
#include <math.h> 


int main(void) | 
floata, b,c, d, e, f, g. h; 


a=cos(0); // 1, note: the input argument is in radians 
b=2 * acos(0); // pi (acos means arc cosine) 

c =sqrt(144); // 12 

d=exp(2); // e^2 =7.389056, 

e = 109(7.389056); // 2 (natural logarithm, base e) 

f = 10g10(1000) ; // 3 (log base 10) 

g = floor(178.567); // 178, rounds to next lowest whole number 
h= pow(2, 10); // computes 2 raised to the 10th power 


printf(“a=%.0f, b= %f, c=%.0f, d=%.0f, e=%.2f, f=2.0F, g=%.2F, h=%.2f\n", 
a, b, C, d, eS. f, g, h); 
} 


控制 台 输 出 


a=]1, b=3.141593, c=12,d=7, e=2.00, f=3, g=178.00, h= 1024.00 


C.9.4 string 
字符 串 库 string.h EHA HARFI ROCHERS. ER PMA: 


// copy src into dst and return dst 
char *strcpy(char *dst, char *src); 


// concatenate (append) src to the end of dst and return dst 
char *strcat(char *dst, char *src); 
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// compare two strings. Return 0 if equal, nonzero otherwise 
int strcemp(char *sl, char *s2); 


// return the length of str, not including the null termination 
int strlen(char *str); 


C.10 ”编译 器 和 命令 行 选项 

虽然 我 们 已 经 介绍 了 相对 简单 的 C 程序 ， 但 现实 世界 的 程序 可 以 由 几 十 个 甚至 上 千 个 C 文 
件 组 成 ， 以 便 实 现 模块 化 、 可 读 性 ， 以 及 多 个 程序 员 的 合作 。 本 节 将 介绍 如 何 编译 分 布 在 多 个 
C 文件 的 程序 ， 并 说 明 如 何 使 用 编译 器 选项 和 命令 行 参数 。 
C. 10. 1 编译 多 个 C 源 文件 


多 个 C 文件 通过 如 下 所 示 的 在 编译 行 中 列 出 所 有 文件 名 将 其 编译 为 一 个 可 执行 文件 。 请 记 
住 , 一 组 C 文件 仍然 只 能 包含 一 个 main 函数 ， 它 通常 放置 在 一 个 名 为 main. c 的 文件 中 。 


gcc main.c file2.c file3.c 


C. 10.2 编译 器 选项 


编 详 需 选项 允许 程序 员 指 定 诸如 输出 文件 名 和 格式 、 优 化 等 。 编 译 器 选项 并 未 规范 化 ， 但 
表 C-7 列 出 那些 常用 的 选项 。 在 命令 行 上 ， 每 个 选项 通常 前 面 加 一 个 破 折 号 (-)， 如 表 C-7 所 
示 。 例 如 ，”-o” 选 项 允许 程序 员 指 定 输出 文件 名 ， 而 不 采用 默认 的 a .out。 存 在 大 量 的 选 
项 ， 它 们 可 以 通过 在 命令 行 中 键 人 gcc -- help 查看 。 


表 C-7 编译 器 选项 

编译 器 选项 示例 
-ooutfile gcc -o hello hello.c 
-s 创建 汇编 语言 输出 文件 (不 可 执行 文件 ) rm ey 
= 详细 模式 一 一 在 完成 编译 时 输出 编译 结果 和 过 程 gcc -vhello.c 
de 指定 优化 水 平 (通常 为 0~3)， 生成 更 快 和 更 小 的 代码 ， 但 其 代 weak 二 

价 是 较 长 的 编译 时 间 
- -help gcc - -help 
-wall gcc -Wall hello.c 


C. 10.3 命令 行 参数 


与 其 他 函数 一 样 ,main 也 可 以 接收 输入 变量 。 然 而 ， 与 其 他 函数 不 同 ， 这 些 参数 在 命令 行 
中 指定 。 如 C 代码 示例 C. 50 所 示 ，argc 代表 参数 计数 ， 它 表示 命令 行 上 参数 的 个 数 。argv 
表示 参数 向 量 ， 它 是 在 命令 行 上 发 现 的 字符 串 数组 。 例 如 ,假设 C 代码 示例 C. 50 的 程序 被 纺 
译 成 可 执行 文件 testargs。 当 在 命令 行 键入 以 下 行 时 ，argc 的 值 是 4， 数 组 argv 的 值 为 
{"./testargs", "ARG1","25","lastarg! 路 。 注 意 ， 可 执行 文件 名 被 算 作 第 一 个 参数 。 
键入 此 命令 后 ， 控 制 台 输出 C 代码 示例 C. 50 所 示 的 代码 。 


gcc -o testargs testargs.c 
./testargs argl 25 lastarg! 


需要 数字 参数 的 程序 可 以 使 用 stdlib. h 中 的 函数 将 字符 串 参 数 转换 为 数字 。 
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C 代码 示例 C. 50 


// Print command line arguments 
#include <stdio.h> 


int main(int argc, char *argv[]) 
{ 
int i; 
for (i=0; i<arge; i++) 
printf("argvl4d] =%s\n", i, argv[i]); 
} 


控制 台 输出 


argv[0] ./testargs 
argv[1] =argl 
argv[2] = 25 

argv[3] = lastarg! 


C. 11 常见 错误 
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命令 行 参数 


和 任何 编程 语言 一 样 ， 你 几乎 可 以 肯定 当 你 写 C 程序 时 会 犯错 误 。 以 下 是 用 C 语言 编程 的 
一 些 常见 错误 的 描述 。 有 些 错误 是 特别 麻烦 的 ， 因 为 它们 可 以 通过 编译 ， 但 并 不 按照 程序 员 想 


要 的 功能 执行 。 


C 代码 错误 C. 1 
错误 代码 


int a; 
printf("Enter an integer:\t"); 
scanf("%d", a); // missing & before a 


scanf 中 缺失 & 
更 正 后 代码 


int a; 
printf("Enter an integer:\t"); 
scanf("%d", &a); 


C 代码 错误 C. 2 在 比较 语句 中 使 用 = 代替 == 


错误 代码 


if (x=1) // always evaluates as TRUE 
printf("Found!\n"); 


更 正 后 代码 


tf (x == 7) 
printf("Found!\n"); 


C 代码 错误 C. 3 索引 超出 数组 的 末端 元 素 


错误 代码 


int array[10]; 


array[10] = 42; // index is 0-9 


更 正 后 代码 


int array[10]; 
array[9] = 42; 


C 代码 错误 C. 4 在 #define 语句 中 使 用 = 


错误 代码 


// replaces NUM with "= 4" in code 
#define NUM= 4 


更 正 后 代码 
#define NUM 4 


C 代码 错误 C. 5 使 用 未 初始 化 的 变量 


错误 代码 
inti; 
if (i ==10) // i is uninitialized 


更 正 后 代码 


int i = 10; 
if (ji == 10) 
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C 代码 错误 C. 6 ”未 包含 用 户 创建 头 文件 的 路 径 
错误 代码 更 正 后 代码 


#include "myfile.h" #include “othercode\myfile.h” 


C 代码 错误 C.7 ”使 用 逻辑 运算 符 ( !，|1，&&) 代替 位 运算 符 ( ~, |, a) 


错误 代码 更 正 后 代码 

char x=!5; // logical NOT: x=0 char x=~5; // bitwise NOT: x =0b11111010 
char y=5||2: // logical OR: y=1 char y=5|2;// bitwise OR: y=0b00000111 
char z=5&&2; // logical AND: z=1 char z=5&2;// logical AND: z=0b00000000 


C 代码 错误 C. 8 在 switch/case 语句 中 遗漏 break 语句 


错误 代码 更 正 后 代码 

charx='d'; char x= 'd'; 

switch (x) { switch (x) | 
case ‘u’': direction=l1; case 'u': direction=1; break; 
case 'd': direction=2; case ‘d': direction = 2; break; 
case '1': direction = 3; case '1': direction = 3; break; 
case 'r': direction=4; case 'r': direction = 4; break; 
default: direction=0; default: direction=0; 

} } 

// direction =0 // direction = 2 


C 代码 错误 C. 9 ”遗漏 大 括号 { } 


错误 代码 更 正 后 代码 

if (ptr == NULL) // missing curly braces if (ptr == NULL) | 
printf( "Unable to open file.\n"); printf("Unable to open file.\n"); 
exit(1); // always executes exit(1); 


) 


C 代码 错误 C. 10 ”在 函数 声明 之 前 使 用 函数 


错误 代码 更 正 后 代码 
int main(void) void test(void) 
{ ava 

test(); } 


| int main(void) 
void test(void) | 

(ss test); 

} } 





C 代码 错误 C. 11 用 同一 个 名 称 声明 局 部 和 全 部 变量 





错误 代码 更 正 后 代码 
int x =5; // global declaration of x int x = 5; // global declaration of x 
int test(void) int test(void) 
{ | 
intx=3; // local declaration of x int y=3; // local variable is y 


} } 





C 代码 错误 C. 12 在 数组 声明 后 尝试 使 用 { } 初 始 化 该 数组 


错误 代码 更 正 后 代码 


int scores[3]; int scores[3] = {93, 81, 97}; 
scores = {93, 81, 97}; // won't compile 
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C 代码 错误 C. 13 ”使 用 = 将 一 个 数组 赋值 给 另 一 个 数组 


错误 代码 更 正 后 代码 

int scores[3] = (88, 79, 93}; int scores[3] = (88, 79, 931; 
int scores2[3]; int scores2[3]; 

scores? = scores; for (i=0; 1<3; i++) 


scores2[1] = scores[i]: 


C 代码 错误 C. 14 do/while 循环 后 遗漏 分 号 


错误 代码 更 正 后 代码 
int num; int num; 
do | do | 

num = getNum(); num = getNum(); 


} while (num < 100) // missing ; ) while (num < 100); 


C 代码 错误 C. 15 for 循环 使 用 逗号 代替 分 号 
错误 代码 更 正 后 代码 


for (i=0, í < 200, i++) for (i=0; 1 < 200; i++) 


C 代码 错误 C. 16 ”整数 除法 代替 浮 点 数 除法 


错误 代码 更 正 后 代码 

// integer (truncated) division occurs when // at least one of the arguments of 
// both arguments of division are integers // division must be a float to 
floatx=9/4; //x=2.0 // perform floating point division 


floatx=9.0/4; //x=2.25 


C 代码 错误 C. 17 写 入 未 初始 化 的 指针 


错误 代码 更 正 后 代码 
int *y= 77; int x, *y=&x; 
ey = 1s 


C 代码 错误 C. 18 过 大 的 期 望 (或 缺乏 ) 


一 个 常见 的 初学 者 错误 是 写 一 个 完整 的 程序 (通常 没有 模块 化 ) ， 并 期 望 它 第 一 次 就 完美 地 运行 。 对 于 复杂 的 程 
序 ， 写 模块 化 代码 并 逐步 测试 各 个 功能 是 必 不 可 少 的 。 随 着 程序 复杂 度 的 提高 ， 调 试 困 难 呈 指数 上 升 且 非 常 耗 时 。 

另 一 个 常见 错误 是 缺乏 期 望 。 当 发 生 这 种 情况 时 ， 程 序 员 仅 可 以 验证 该 代码 可 以 生成 结果 ， 而 不 是 其 结果 是 否 
正确 。 在 验证 功能 性 方面 使 用 已 知 输入 和 预期 结果 来 测试 程序 是 很 关键 的 。 | 


本 附录 主要 讨论 在 具有 控制 台 的 系统 中 使 用 C 语言 ， 如 Linux 计算 机 。8.6 节 描 述 了 如 何 
使 用 C iB TERRA SK PIC32 微 控 制 器 上 编程 。 微 控制 器 通常 用 C 语言 进行 编程 ， 因 为 C 语言 
供 了 与 汇编 语言 几乎 一 样 多 的 人 硬件 底层 控制 ,但 它 更 加 简洁 易 写 。 
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D.1 引言 


本 书 详细 描述 了 MIPS 处 理 器 体系 结构 的 原理 与 设计 准则 。 本 附录 将 阐述 如 何在 现场 可 编 
程 逻 辑 门 阵列 (FPCA) 上 实现 MIPS 处 理 器 。 以 Imagination Technologies 公司 的 MIPSfpga 核心 作 
为 本 节 主 要 描述 对 象 ， 该 内 容 基 于 Imagination 公司 的 MIPSfpga 相关 资料 。 


D.2 MIPSfpga 介绍 


MIPSfpga 是 含有 缓存 与 内 存 管理 单元 的 MIPS32@ microAptiv 微 处 理 器 ， 是 由 Imagination 公 
司 推出 的 用 于 教育 用 途 的 微 处 理 器 核心 。 本 文 将 描述 该 MIPS 核心 和 系统 接口 等 ， 阐 述 如 何 模 
拟 与 硬件 实现 该 核心 ， 讲 述 如 何在 MIPSfpga 上 编写 和 运行 程序 。MIPSfpga 包含 的 Verilog 代码 
可 用 于 模拟 ， 也 可 在 FPGA 上 实现 。 使 用 这 种 工业 级 的 MIPS 核心 对 很 多 课程 ,包括 计 算 机 体 
系 结构 、 咀 入 式 系 统 和 片上 系统 设计 来 说 ， 都 是 一 个 很 好 的 补充 。 


D. 3 MIPSfpga 核心 和 系统 


MIPSfpga 核心 是 microAptiv 微 处 理 顺 的 一 个 版 本 。microAptiy 微 处 理 器 已 经 被 广泛 应 用 在 
工业 、 办 公 室 自动 化 、 自 动 驾 驶 、 消 费 性 电子 产品 和 无 线 通 信 等 商业 领域 。MIPSfpga 核心 使 用 
硬件 描述 语言 Verilog 实现 。 因 为 MIPSfpga 是 使 用 软件 ( Verilog) 描述 而 不 是 在 计算 机 芯片 上 制 
造 出 来 的 ， 所 以 也 称 为 软 核 处 理 右 。 

MIPSfpga 由 大 约 1.2 万 条 Verilog 语句 构成 ， 并 具有 以 下 特点 : 

e microAptiv 微 处 理 需 核心 运行 的 是 5 级 流水 线 、1.5 Dhrystone MIPS/MHz 的 MIPS32 指令 
架构 。 

2 路 组 相连 指令 和 数据 高 速 缓存 (每 一 个 大 小 为 2KB)。 
拥有 16 项 TLB 的 内 存 管理 单元 。 

AHB-Lite 总 线 接 口 。 

EJTAG 编程 器 /调试 器 ， 包 括 2 条 指令 和 1 个 数据 断 点 。 
性 能 计数 器 。 

输入 同步 装置 。 

能 够 扩展 用 户 自 定义 指令 。 

没有 数字 信号 处 理 扩展 、 协 处 理 器 2 接口 或 者 影子 寄存 器 。 
其 中 ，microAptiv 微 处 理 器 使 用 MIPSr3 版 本 的 MIPS 指令 集 。 

图 D-1 展示 了 MIPSfpga 处 理 器 核心 的 整体 框图 。 处 理 器 的 核心 部 分 是 执行 单元 (execution 
unit) 。 它 根据 指令 来 执行 各 种 操作 ， 如 加 法 操作 或 减法 操作 。 乘 除法 单元 (Multiply/Divide U- 
nit，MDU ) 是 一 个 扩展 的 单元 ， 用 来 执行 乘法 操作 或 除法 操作 。 指 令 译 码 器 (instruction decod- 
er) 从 指令 缓存 中 获取 指令 ， 然 后 产生 控制 信号 让 执行 单元 执行 相应 的 操作 。 系 统 协 处 理 器 
(system co-processor) 单 元 主要 提供 系统 接口 信号 ， 如 系统 时 钟 和 复位 。 通 用 寄存 器 ( General 
PurposeRegister，GPR ) 单元 中 存储 的 是 可 以 作为 指令 操作 数 使 用 的 通用 寄存 器 。 
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MIPS 


通用 UDI COP2 


寄存 器 。 接口 O 功 耗 管理 


EER 


执行 单元 > ZA 


f 


指令 译 码 器 


( MIPS32 ) 


| | 


数据 高 速 PDN 指令 高 速 
Yl ts oe Sinaia 内 存 管理 单元 > 措 令 高 速 +> poe 
缓存 缓存 


缓存 缓存 
控制 器 : | 控制 器 


调试 和 分 析 器 总 线 接口 单元 





JTAG D-SRAM AHB-Lite LSRAM 
接口 接口 接口 接口 


图 D-1 MIPSfpga 处 理 器 核心 


图 D-1 顶部 的 其 他 几 个 接口 (UDI、COP2 以 及 中 断 接 口 ) 能 让 处 理 器 分 别 运行 用 户 自 定义 
的 指令 、 与 协 处 理 器 2 单元 相连 接 以 及 接收 外 部 中 断 。 指 令 和 数据 高 速 缓存 (I- Cache 和 D- 
Cache) ) 将 它们 连接 到 各 自 的 控制 器 上 ， 然 后 再 与 内 存 管理 单元 ( MMU ) 连 接 。 内 存 管理 单元 主 
要 负责 内 存 地 址 转换 和 把 缓存 中 没有 的 指令 或 数据 从 内 存 中 取出 来 。 总 线 接口 单元 (Bus Inter- 
face Unit, BIU) 使 用 户 能 够 通过 AHB-Lite 总 线 在 处 理 器 上 访问 内 存 和 内 存 映 射 IO。 在 D.4.2 
节 ， 我 们 将 详细 介绍 AHB-Lite 接口 。 数 据 和 指令 暂 存 RAM 接口 (D-SRAM il I-SRAM 接口 ) 使 
处 理 器 能 够 以 较 低 的 延迟 访问 片上 存储 锅 。 调 试 和 分 析 顺 (Debug and Profiler) 单元 提供 调试 、 
性 能 监控 和 下 载 程 序 使 用 的 EJTAG 接口 。 我 们 将 在 D. 6 节 详 细 介 绍 这 个 单元 。 

MIPSfpga 核心 拥有 5 级 流水 线 ， 表 D-1 列 出 了 每 级 流水 线 和 各 级 流水 线 的 简 述 。 


表 D-1 MIPSfpga 流水 线 
序号 描述 
1 | I | 取 指 | 处 理 器 读 取 指令 


处 理 器 从 寄存 器 堆 中 获取 操作 数 ， 然 后 执行 ALU 操作 ( 如 ， 加 法 、 减 法 或 者 计 


执行 | 算 内 存 地 址 ) 
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(2) 


序号 描述 

3 | M | 访 存 ”| 如 果 需 要 ， 处 理 器 从 内 存 中 读 取 操作 数 

4 如 果 需 要 ， 对 加 载 的 数据 进行 字 边 界 对 齐 
5 | w | 写 回 | MERE, 处 理 器 将 结果 写 回 到 寄存 器 堆 中 


MIPSfpga 有 32 位 的 地 址 空间 和 3 个 运行 模式 : 
内 核 、 用 户 和 调试 。 复 位 后 ， 处 理 器 首先 进入 内 核 
模式 ， 然 后 跳 转 到 复位 向 量 0xbfe00000。 图 D-2 展 
示 了 MIPSfpga 的 内 存 映射 。 地 址 0xbfc00000 属于 内 
核 段 1(ksegl ) ， 这 段 地 址 不 经 过 缓存 和 地 址 映射 。 
这 就 意味 着 这 个 地 址 空间 中 的 指令 不 经 过 缓存 直接 
从 外 部 存储 器 获取 ， 并 且 这 段 采用 固定 的 从 虚拟 地 
址 到 物理 地 址 的 映射 ， 而 不 采用 MMU, RARER, 
因为 在 复位 后 ,缓存 和 内 存 管理 单元 都 不 会 马上 被 初 
始 化 。 固 定 的 地 址 映射 表 通 过 将 虚拟 地 址 减 去 
0xa0000000 把 ksegl 映射 到 物理 地 址 0x00000000。 因 
此 ,在 复位 后 ,程序 从 内 存 物 理 地 址 0x1fc00000 开始 
执行 。 

D-3 中 展示 了 MIPSfpga 系统 关键 部 件 。 系 统 
从 FPGA 板 卡 或 者 模拟 测试 中 接收 时 钟 、 复 位 和 
EJTAG 编程 信号 。 它 与 外 部 的 LED 灯 和 拨 码 开关 相 
连接 ， 并 驱动 总 线 接口 信号 。mipsfpga_sys 模块 包含 
ml4k-top microAptiv 核 ml4k_top 模块 和 mipsfpga_ 
ahb 模块 ，mipsfpga_ahb 模块 包含 RAM, GPIO 和 
AHB- Lite 总 线 接口 逻辑 。 

图 D-4 展示 了 mipsfpga_ahb 模块 提供 的 物理 内 
存 映射 。 包 含 了 从 地 址 0xlfc00000 开始 的 存放 系统 
复位 后 执行 代码 的 128KB RAM 内 存 块 和 从 地 址 


OxFFFFFFFF 


OxFF400000 


OxFF3FFFFF 

OxFF200000 

OxF1FFFFFF 

OxDEFEFEFE 
映射 内 核 虚 拟 地 址 

xsG0990000 空间 ，512MB 
未 映射 内 核 虚 所 地 址 | 
23 旧 

40000000 空间 ， 未 缓存 512MB 
未 映射 内 核 虚 所 地 址 

Azi 
0280000000 z8], 512MB 
0x7FFFFFFF 


meit FAP hE 
空间 ，2048MB 





0x00000000 
1. 这 个 空间 在 用 户 或 内 核 模式 下 被 映射 到 内 存 ， 
并 在 调试 模式 下 通过 EJTAG 模 块 映 射 。 


图 D-2 ”内 存 映射 


0x00000000 开始 的 存放 其 他 数据 和 代码 的 256KB RAM 内 存 块 。 除 此 之 外 ， 还 有 4 个 控制 LED 
灯 和 拨 码 开关 的 GPIO 寄存 器 ， 将 在 D. 4. 3 节 中 详细 介绍 。 复位 后 执行 的 代码 可 以 一 开始 就 从 
内 存 初始 化 文件 中 加 载 ， 也 可 以 通过 D. 6. 5 节 描 述 的 EJTAG 下 载 。 


SI Clkln SI Reset N EJTAG 





AHB St 
mipsfpga_ahb 








ml4k top 
mipsfgpa_sys 


AHB 接 口 
图 D-3 -MIPSfpga 系统 关键 部 件 


Eee i Se. 
RAM 
GPIO 





0x1 FCLFFFC 





- 0x00000000 
图 D-4 MIPSfpga 物理 内 存 映 射 
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D.4 MIPSfpga 接口 

MIPSfpga 系统 有 3 个 主要 的 接口 : AHB-Lite BA, FPGA REVO, EJTAG 接口 。MIPSfpga 
核心 通过 AHB- Lite 总 线 连 接 内 存 和 外 围 设备 。FPGA 板 卡 VO 接口 允许 MIPSfpga 核 访问 FPGA 
板 上 的 拨 码 开关 和 LED 灯 。EJTAG 接口 用 来 下 载 程 序 到 MIPSfpga 核 上 并 进行 实时 调试 。 这 一 
小 节 首 先 给 出 这 些 接口 信号 的 总 体 描述 ， 然 后 再 对 每 个 接口 进行 详细 描述 。 


D. 4. 1 接口 信号 
K D-2 列 出 了 Nexys4 DDR 板 卡 (包含 Xilinx 的 Artix-7 FPGA) 和 DE2-115 板 卡 (包含 Altera 
的 Cyclone IV FPGA ) 的 简要 说 明 。 


表 D-2 FPGA 板 卡 规格 


板 卡 开发 软件 价格 (美元 ) 网 站 


320 eee 
Nexys4 DDR Vivado Design Suite 159( 学 术 价 ) www. digilentinc. com 
DE2-115 artus I] Cyclone IV aT de2-115. terasic. com 
- Quartus yclone 309 (REY) > i 


# D-3 中 列 出 了 MIPSfpga Wna, Aea SEH F ESLER : 
e Sl: 系统 接口 信号 

IO: FPGA 板 卡 VO 信号 

H: AHB-Lite 总 线 信 号 

EJ: EJTAG 接口 信号 


表 D-3 MIPSfpga 处 理 器 接口 信号 


MIPSfpga Nexys4 DDR 板 卡 
SI_Reset_N CPU_RESETN 
SI_ClkIn clk_out( SOMHz) 










系统 







clk_out(47MHz) 


AHB- Lite 
OSI7 ET 
ami KEY[3:0] 
TEDR[17:0] 
LEDG[17:0) 
EXT 1016) 
EXT 0[5] 
EXTJIO[4] 
ETAC EXT IOS 
EXTOL 2 
EXT IOLI] 
ExT IOLO) 


时 钟 信号 SLClkIn 是 处 理 器 的 系统 时 钟 信 号 。MIPSfpga 在 Nexys4 DDR 板 卡 上 运行 在 由 100MHz 
衍生 的 50MHz 频率 上 ， 在 DE2-115 板 卡 上 运行 在 由 50MHz 衍生 的 47MHz 频率 上 。 复 位 信号 (SI_Reset 
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_N) 为 低 电 平 有 效 ( “_N” 后缀 表明 为 低 电 平 有 效 )。 按 下 复位 按钮 (Nexys4 DDR 板 卡 上 的 CPU_RE- 
SETN 或 者 DE2-115 板 卡 上 的 KEY[0] ) 使 复位 信号 变 成 低 电 平 ， 然 后 复位 处 理 咒 。 处 理 融 必须 在 上 
电 后 复位 。 下 面 对 AHB- Lite 总 线 、 板 卡 WO 以 及 EJTAG 信号 进行 详细 描述 。 


D. 4.2 AHB-Lite 接口 


在 很 多 微 处 理 器 ， 特 别 是 在 花 人 式 系统 中 ,， 都 用 到 先进 高 性 能 总 线 (Advanced High- per- 
formance Bus, AHB) F WIO., AHB 总 线 便 于 多 个 设备 或 者 外 围 设 备 的 连接 。AHB- Lite 是 
AHB 的 一 个 精简 版 ， 只 有 一 个 总 线 主 设备 。 本 节 只 是 描述 了 AHB- Lite 总 线 的 一 些 基 本 操作 ， 
你 可 以 参考 AHB- Lite 接口 指南 来 获取 更 多 关于 AHB_Lite 总 线 的 信息 。 

图 D-5 展示 了 MIPSfpga 处 理 器 中 的 AHB- Lite 总 线 。 图 中 的 AHB-Lite 总 线 配置 有 一 个 主 设 
备 : MIPSfpga 处 理 器 ; 3 个 从 设备 : RAM0、RAM1、GPIO， 其 中 两 个 为 RAM 模块 ， 一 个 为 FP- 
GA WF WO( 拨 码 开关 和 LED 灯 ) 访 问 模块 。 主 设备 (人 处理 器 ) 发 送 时 钟 、 写 使 能 信和 号、 地 址 、 
写 数据 信号 到 HCLK, HWRITE, HADDR, HWDATA 上 ,根据 地 址 从 多 个 从 设备 中 的 一 个 读 取 
数据 (HRDATA ) 。 地 址 译 码 器 (address decoder) 根据 地 址 生成 从 设备 选择 信号 (HSEL) 。 


AHB-Lite 
总 线 





图 D-5 AHB-Lite 总 线 


AHB-Lite 传输 包含 两 个 时 钟 周期 : 地 址 阶段 和 数据 阶段 。 在 地 址 阶段 内 ， 主 设备 发 送 地 址 
到 HADDR 上 ， 如 果 要 写 数据 ， 则 把 HWRITE 拉 至 高 电 平 ， 如 果 要 读数 据 ， 则 把 HWRITE 降 至 
低 电 平 。 在 数据 阶段 肉 ， 如 果 是 写 操作 ， 则 主 设备 会 把 数据 送 到 HWDATA 上 ， 如 果 是 读 操 作 ， 
则 从 设备 会 把 数据 送 到 HRDATA 上 。 图 D-6 和 图 D-7 分 别 展示 了 写 和 读 时 的 波形 图 。 


HCLK 
HADDR{31:0] 
HWRITE 


HWDATA[31:0] 





图 D-6 AHB-Lite 4& 


在 MIPSfpga 中 ， 从 设备 模块 和 地 址 译 码 器 都 包含 在 mipsfpga_ahb 模块 和 它 的 子 模块 中 。 在 
RAMO 中 存储 系统 启动 时 执行 的 指令 。 在 复位 时 ， 处 理 器 把 PC 的 值 设 置 为 复位 异常 地 址 : 物 
理 地 址 Ox1 fe00000 ( 虚拟 地 址 Oxbfc00000) 。RAMI1 是 从 物理 地 址 0 开始 的 可 访问 内 存 。GPIO 从 
设备 模块 用 来 与 FPGA 板 卡 IO 进行 交互 ， 接 下 来 我 们 将 详细 介绍 这 个 模块 。 
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HCLK 
HADDR{31:0] 
HWRITE 


HRDATAI31:0] 





图 D-7 AHB-Lite 7 


D.4.3 FPGA 板 卡 接口 


两 块 FPCA 板 卡 (Nexys4 DDR 和 DE2-115) 上 的 LED 灯 和 拨 码 开关 都 通过 印刷 电路 板 (PCB ) 上 
的 导线 与 FPGA 的 引 脚 连接 到 一 起 。 图 D-8 和 图 D-9 分 别 显示 了 这 两 块 FPGA 板 卡 上 的 IJA0。 





图 D-8 Nexys4 DDR FPGA 板 卡 
USB-Blaster 





图 D-9 DE2-115 FPGA 板 卡 
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AHB- Lite 总 线 上 的 通用 1/0( GPIO) 模 块 通过 内 存 映 射 VO 将 数据 写 到 FPGA 板 卡 VO 或 者 从 
FPGA 板 卡 WO 读数 据 。 使 用 内 存 映射 WO， 处 理 器 就 能 像 访 问 内 存 一 样 访问 VO 设备 (也 叫 外 部 
设备 ) 。 每 个 外 部 设备 被 映射 到 一 个 特定 的 内 存 地 址 。 表 D-4 列 出 了 FPGA 板 卡 WO 的 内 存 地 址 。 
虚拟 地 址 是 在 MIPS 指令 中 使 用 的 地 址 ， 物 理 地 址 是 出 现在 AHB- Lite 总 线 HADDR 上 的 地 址 。 


R D-4 PGA 板 卡 的 内 存 上 映射 1/0 地 址 
ET DELIS 机 下 
Ox 000 红色 LED 
OO 000 tk LED 
osso oos | OO | IOSW ”| 开关 | ”开关 
DB 000 re 


例如 ， 下 面 的 MIPS 指令 将 0x543 写 到 LED 灯 上 (DE2-115 上 的 红色 LED 灯 ) : 


addiu $7, $0, 0x543 # $7 = 0x543 
lui $5, 0xbf80 # $5 = Oxbf800000 (LED 地 址 ) 
sw $7, 0( $5) # LEDs = 0x543 


同样 ， 下 面 的 MIPS 指令 把 拨 码 开关 的 值 读 到 寄存 器 $10 中 ; 
lui sS5，0xbf80 # $5 = 0xbf800000 
lw $10, 8($5) # $10-= 开关 的 值 


拨 码 开关 信号 只 有 18 位 ， 所 以 在 读 拨 码 开关 的 值 时 只 把 低 18 位 存 人 寄存 器 $10 中 ， 高 14 
位 设置 为 全 0。 


D.4.4 EJTAG 接口 


EJTAG 是 一 个 支持 : 1) 基于 硬件 的 调试 ; 2) 下 载 程序 到 MIPS 核 上 的 协议 。TCK、TDI、 
TDO, TMS 和 TRST 等 信号 都 能 称 为 测试 访问 端口 (Test Access Port, TAP), EJTAG 借鉴 了 
JTAG 协议 中 下 列 这 些 信号 的 功能 : 

EJ_TCK; Test Clock ， 测 试 时 钟 信和 号。 

EJ_TMS: Test Mode Select， 测 试 模式 选择 信号 一 一 选择 操作 方式 。 

EJ_TDI: Test Data In， 测 试 数据 输 入 一 一 移入 处 理 器 测试 或 编程 逻辑 的 数据 。 
EJ_TDO; Test Data Out， 测 试 数据 输出 一 一 移出 处 理 器 测试 或 编程 逻辑 的 数据 。 

e EJ_TRST_N_probe; Test Reset， 测 试 复位 信号 ， 低 电 平 有 效 一 一 复位 EJTAG 控制 大 

除 此 之 外 ，EJTAG 还 有 调试 中 断 请 求 信号 EJ_DINT, EJTAG 接口 主要 由 D.6 节 介 绍 的 编程 
和 调试 工具 使 用 。 


D. 5 示例 程序 


本 节 通 过 两 个 简单 的 程序 来 说 明 如 何在 MIPSfpga 核心 上 运行 程序 。 这 些 简单 的 程序 不 需 
要 对 处 理 器 进行 任何 设置 就 能 直接 运行 。 一 些 更 高 级 的 程序 可 能 会 要 求 初 始 化 缓存 或 者 MMU 
等 。 这 些 初始 化 设置 需要 由 引导 代码 或 者 启动 代码 来 完成 。D.6 节 将 描述 如 何 使 用 Codescape 
MIPS SDK 开发 环境 、Open0CD、gdb 开源 调试 器 、 从 USB 到 EJTAG 接口 转换 的 Bus Blaster 下 
载 器 以 及 引导 代码 来 运行 更 高 级 的 程序 。 


D. 5. 1 示例 程序 内 存 映 射 输出 (LED 灯 ) 


示例 程序 D. 1 给 出 了 一 个 内 存 映 射 输出 示例 程序 的 C 语言 和 汇编 语言 代码 。 如 C 语言 代码 所 
示 ， 变 量 val 初始 化 为 1。 每 一 次 循环 都 把 val 输出 到 LED 灯 上 (内存 地 址 为 0xbf800000) ， 然 后 
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递增 。 每 次 循环 都 有 1 秘 的 延迟 ， 这 样 人 眼 才 能 观察 到 LED 灯 上 显示 的 内 容 。 


示例 程序 D. 1 IncrementLEDsDelay 程序 


/WC 代码 # MIPS 汇编 代码 

unsigned int val = 1; # $9 = val, $8 = memory address 0xbf800000 
volatile unsigned int * ledr addiu $9 uo, L #val =1 

ptr lui $8, Oxbf80 # $8 =0xbf800000 


ledr_ptr = 0xbf800000; 


while (1) { 
*ledr_ptr = val; Ll: sw $9,0($8) #mem[(Oxbf800000)] = val 
val = val +1; addiu 人 594 1 # val. = ,val +1 
// delay delay: # loop 2,500,000 
} lui $5, 0x026 # $5 = 2,500,000 
ori $5, $5, 0x25a0 
add S6,. 50, 50 .& 56 = 0 
L2: sub STara £23; SOTSA = 2,500,000 - $6 
addi S'6, 6; 2 #increment $6 
bgtz S7, lia # finished? 
nop # branch delay slot 
beqz $0, El # branch to L1 
nop # branch delay slot 


处 理 器 复位 后 ,缓存 没有 被 初始 化 。 在 缓存 还 没有 初始 化 前 ， 每 条 指令 的 执行 需要 花费 5 
个 时 钟 周期 。 因 此 ， 延 时 循环 中 的 4 条 指令 (从 L2 到 第 一 个 nop 指令 ) ， 每 条 指令 需要 执行 5 
个 时 钟 周期 。 系 统 在 Nexys4 DDR FPGA 板 卡 上 以 50MHz 的 频率 执行 ， 延 时 循环 2 500 000 次 需 
要 花费 的 时 间 大 约 为 1 秒 ， 这 个 时 间 可 以 根据 下 式 (D-1) 计 算出 来 : 

2 500 000 次 循环 x (4 指令 /迭代 ) x (S 个 时 钟 周期 /指令 ) x (1 秒 /50 000 000 周期 ) = 1 秒 
(D-1) 
在 DE2-115 FPGA 板 卡 上 使 用 47MHz 的 时 钟 产生 的 延 时 也 是 大 约 1 秒 。 

按 下 复位 按钮 后 ，MIPSfpga 核心 把 程序 计数 器 ( PC) 的 值 设 置 为 0xbfe00000， 然 后 开始 执 
行 。 虚 拟 地 址 0xbfc00000 映射 到 物理 地 址 0xlfc00000。 复 位 RAM， 也 就 是 图 D-5 FH RAMO 保 
存 的 是 从 这 个 地 址 开始 的 内 存 空间 ， 把 示例 程序 D. 1 的 代码 预 加 载 到 RAMO 中 (ahb_ ram_re- 
set 模块 ) ahb ram reset 模块 会 把 内 存 初 始 化 文件 ram reset init. txt( 示 例 程序 
D.2 所 示 ) 中 的 指令 加 载 到 内 存 中 。 指 令 从 最 低地 址 0xbfc00000 开始 存放 。 第 一 条 指令 
(0x24090001 ) 位 于 内 存 地 址 0xbfc00000， 第 二 条 指令 位 于 地 址 0xbfc00004 等 。 


示例 程序 D.2 IncrementLEDsDelay 程序 内 存 初 始 化 文件 ram reset init.txt 


24090001 // bfc00000 :addiu $9, 30, 1 
3c08bf80 // bfc00004:1lui $8, Oxbf80 
ad090000 // bfc00008:L1l:sw $9, 0( $8) 
25290001 // bfc0000c:addiu $9, $9, 1 
3c050026 // bfc00010: delay: lui $5, 0x026 
34a525a0 // bfc00014:ori $5, $5, 0x25a0 
.00003020 // bfc00018 :add $6, $0, $0 
00a63822 // bfc0001c: L2:sub $7, $5,436 
20c60001 // bfc00020 :addi $6, $6,1 
lce0fffd // bfc00024:bgtz ST r-i 
00000000 // bfc00028 :nop 

1000 fff6 // bfc0002c:beq $0, $0, Ll 


00000000 // bfc00030 :nop 





MIPS 处 理 器 的 FPGA 实现 441 


D.5.2 示例 程序 内 存 映射 VYO ( 拨 码 开关 与 LED 47) 


示例 程序 D. 3 中 的 MIPSfpga 同时 对 FPGA 板 卡 上 的 内 存 映射 WO 进行 写 人 和 读 取 。 这 个 程序 
不 断 地 读 取 FPGA 板 卡 上 的 拨 码 开关 和 按钮 的 值 ， 然 后 把 这 些 值 显示 到 红色 和 绿色 的 LED 灯 上 。 
(注意 : Nexys4 DDR 板 卡 上 没有 绿色 的 LED 灯 ， 所 以 运行 这 个 程序 时 不 会 显示 按钮 的 值 。) 


示例 程序 D. 3 Switches&LEDs 程序 


1 CRB # MIPS 汇编 代码 

unsigned int sw, pb; # $10 = sw, $11 = pb 

unsigned int*ledr ptr; 

unsigned int*ledg ptr; lui $8, Oxbf80 

unsigned int*sw_ptr; addiu $12, $8,4 # $12 = LEDG addr 
unsigned int*pb ptr; addiu $13, $8,8 # $13 = SW addr 


addiu $14, $8, Oxc# $14 = PB addr 
ledr ptr = 0xbf800000; 


ledg ptr = 0xbf800004; readIO: 
sw ptr = 0xbf800008; lw $10, 0( $13) # sw = SW values 
pb ptr = 0xbf80000c; lw $11, 0($14) # pb = PB values 
sw $10, 0( $8) # store sw to LEDR 
while (1) { sw $11, 0($12) # store pb to LEDG 
sw = * sw ptr; beq $0, $0, readIO# repeat 
pb = * pb ptr; nop # branch delay slot 


*ledr ptr = sw; 
*ledg ptr = pb; 


前 4 条 指令 分 别 把 红色 LED 灯 、 绿 色 LED 灯 、 拨 码 开 关 和 按钮 的 内 存 映射 地 址 存储 到 寄 
存 器 8、12、13 和 14 中 。 然 后 ， 接 下 来 的 两 条 lw EF) 指令 分 别 从 拨 码 开关 和 按钮 上 读 取 数 
据 存 储 到 寄存 器 10 和 11 中 。 最 后 ， 接 下 来 的 两 条 sw 存 字 ) 指 令 把 寄存 器 10 和 寄存 器 11 的 
值 写 到 红色 LED 灯 和 绿色 LED 灯 上 ， 然 后 通过 bea 相等 则 跳 转 ) 指令 循环 执行 这 几 条 读 写 指 
令 。 因 为 $0 总 是 等 于 它 自身 ， 所 以 跳 转 指令 一 定 能 发 生 跳 转 。 示 例 程 序 D.4 展示 了 包含 
Switches&LEDs 程序 机 器 代码 的 内 存 初始 化 文件 ram reset init.txt。 


示例 程序 D. 4 Switches&LEDs 程序 的 内 存 初 始 化 文件 ram reset init .txt 


3c08bf80 //bfc00000 lui $8, Oxbf80 #$8 =LEDR addr 
250c0004 //bfc00004 addiu $12, $8; 4 # $12 =LEDG addr 
250d0008 //bfc00008 addiu $13, $8, 8 #$13 =SW addr 
250e000c //bfc0000c addiu $14, $8, Oxc #$14=PB addr 
8daa0000 //bfc00010 readIO: lw $10, 0( $13) #510 =SW 

8dcb0000 //bfc00014 lw $11, 0($14) #$11=PB 

ad0a0000 //bfc00018 sw $10, 0( $8) #SW -> LEDR 
ad8b0000 //bfc0001c swiSit, 0 ¢ $12} #PB -> LEDG 

1000 fffb //bfc00020b eq $0, $0, readIO #repeat 

00000000 //bfc00024 nop #branch delay slot 


下 面 将 从 模拟 和 硬件 实现 两 个 方面 介绍 如 何 模拟 和 下 载运 行 SwitchesgLEDs 程序 到 
MIPSfpga 核 上 。 


D. 5.3 示例 程序 模拟 
模拟 是 开发 和 调试 一 个 系统 的 硬件 和 软件 至 关 重要 的 一 步 。 模 拟 可 以 便捷 地 观察 系统 内 部 
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信和 号 的 变化 。 可 以 使 用 Mentor Graphics 的 ModelSim 来 进行 模拟 ， 也 可 以 使 用 Xilinx 的 Vivado 或 
者 Altera 的 Quartus IT 的 内 置 模拟 顺 来 进行 模拟 。 以 ModelSim 为 例 ， 执 行 下 面 的 步骤 来 模拟 在 
MIPSfpga 核心 上 运行 示例 程序 D. 3 中 的 Switches&LEDs 程序 。 

e 步骤 1: 复制 示例 程序 D.4 的 ram reset init.txt A| ModelSim 文件 夹 中 。 

© 步骤 2: 打开 ModelSim 软件 项 目 。 

© 步骤 3: 运行 模拟 脚本 语句 。 

© 步骤 4: 观察 模拟 波形 结果 。 

通过 模拟 ， 可 以 在 硬件 实现 前 验证 程序 是 否 按 照 设 定 的 功能 来 执行 。 


D. 5.4 示例 程序 硬件 实现 


本 节 将 说 明 如 何在 Nexys4 DDR 板 卡 和 DE2-115 板 卡 上 运行 MIPSfpga 的 Switches&LEDs 
程序 。 如 果 想 使 用 其 他 FPGA 板 卡 ， 可 以 参考 本 节 后 面 内 容 来 把 MIPSfpga 移植 到 其 他 板 卡 上 。 

对 于 Nexys4 DDR 板 卡 和 DE2-115 板 卡 ， 都 有 相对 应 的 顶层 封装 模块 来 实例 化 MIPSfpga 系 
统 ， 并 将 它们 连接 到 板 卡 上 的 拨 码 开关 、LED 灯 和 复位 按钮 。 顶 层 封 装 模 块 也 使 用 FPGA 的 片 
上 锁 相 环 (PLL) 来 从 板 卡 上 的 时 钟 产 生 系统 时 钟 。 每 个 板 卡 都 需要 一 个 约束 文件 来 指定 时 序 约 
束 并 将 顶层 模块 的 IO 信和 号 与 目标 FPGA 的 物理 引 脚 连接 起 来 。 

通过 以 下 几 个 步骤 可 以 完成 示例 程序 的 硬件 实现 : 

© 步骤 1: 复制 对 应 的 ram reset init .txt 到 HDL 文件 夹 中 。 

。 步骤 2: 打开 PCA 程序 设计 环境 。 

o 步骤 3: 编译 HDL 文件 。 

。 步骤 4: 下 载 到 FPGA 板 卡 。 

© 步骤 5$: 测试 。 

_Nexys4 DDR FPGA 板 卡 


如 果 使 用 Nexys4 DDR FPGA 板 卡 ， 那 么 可 以 使 用 Vivado 软件 把 MIPSfpga 系统 下 载 到 Nex- 
ys4 DDR 板 卡 的 Xilinx Artix-7 FPGA 上 。 图 D-8 显示 了 Nexys4 DDR 板 卡 的 电源 开关 和 USB 接口 
WE s 将 编程 电费 的 标准 USB 端 插入 计算 机 ，micro- USB 端 插入 板 卡 的 USB 接口 (图 D-8 中 标 
有 “USB Programmer Port” (USB 编程 接口 ) 的 位 置 ) 。 然 后 把 电源 开关 拨 到 ON。 如 果 板 卡 是 经 
过 厂家 配置 过 的 ， 那 么 会 运行 一 个 预 装 的 演示 程序 ， 在 7 段 数 码 管 上 不 停 地 显示 蛇 形 图 案 。 男 
外 ， 确 保 板 卡 是 在 JTAG 模式 或 者 QSP 模式 下 ， 像 图 D-8 中 那样 用 跳 线 将 模式 最 左边 的 两 个 跳 
针 连 接 起 来 。 按 照 硬 件 实现 步骤 配置 FPGA 后 ， 就 可 以 在 Nexys4 DDR 板 卡 上 的 Artix-7 FPGA 
上 运行 MIPSfpga 核心 。 按 红色 的 复位 按钮 (标记 有 CPU RESET， 参 考 图 D-8) 来 复位 处 理 器 。 
放 开 按钮 后 ， 处 理 器 程序 就 开始 从 Nexys4 DDR 板 卡 上 的 拨 码 开关 读数 据 ， 然 后 将 数据 写 人 
LED 灯 上 。 拨 动 板 卡 底部 的 拨 码 开关 来 观察 LED 灯 显 示 的 变化 。 


DE2-115 FPGA 板 卡 


如 果 使 用 DE2-115 FPGA 板 卡 ， 那 么 可 以 使 用 Quartus I 软件 把 MIPSfpga 系统 下 载 到 DE2- 

115 板 卡 的 Altera Cyclone IV FPGA 上 。 把 电源 线 插入 红色 电源 开关 上 的 电源 插口 ， 然 后 把 USB 
编程 电缆 的 标准 端 ( USB standard- A ) 插 入 计算 机 ， 另 一 端 插入 图 D-9 中 “USB- Blaster Program- 
”mer Port” (USB- Blaster 编程 接口 ) 接 口上 。 现 在 ; 按 下 红色 电源 按钮 来 打开 电源 。 打 开 电 源 
后 ， 板 卡 会 运行 一 个 预 装 的 演示 程序 在 红色 和 绿色 LED 灯 上 闪烁 一 个 图 案 ， 并 且 在 7 段 数码 管 
上 循环 显示 16 进 制 数字 0 ~F。 确 保 JTAG 编程 跳 线 器 上 接 的 是 跳 针 2 和 跳 针 3 ， 如 图 D-9 所 
示 。 另 外 ， 还 需要 确保 红色 LED 灯 左 边 的 拨 码 开关 朝 上 (处 于 RUN 的 位 置 )。 按 照 硬 件 实现 步 
又 配 置 FPGA 后 ， 就 可 以 在 DE2-115 板 卡 上 的 Cyclone IV FPGA 上 运行 MIPSfpga 核心 。 根据 图 D-9 
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找到 复位 按钮 和 LED 灯 的 位 置 ， 然 后 按 下 复位 按钮 (标记 为 KEY0) 来 复位 处 理 器 。 放 开 按 钮 后 ， 
处 理 器 程序 就 开始 不 断 地 从 DE2-115 板 上 的 拨 码 开关 和 按钮 读数 据 ， 然 后 将 数据 分 别 写 人 红色 
LED 灯 和 绿色 LED 灯 。 拨 动 板 卡 底部 的 拨 码 开关 并 按 动 按钮 来 观察 LED 灯 显 示 的 变化 。 红 色 
LED 灯会 随 着 拨 码 开关 的 变化 而 变化 ， 绿 色 LED 灯会 随 着 按钮 变化 。 按 钮 按 下 时 为 低 电 平 ， 所 以 
绿色 LED 灯会 一 直 亮 着 除非 有 按钮 被 按 下 ( 记 住 ， 按 钮 0 是 处 理 右 复位 按钮 KEYO) ) 。 

移植 到 其 他 FPGA 板 卡 

在 其 他 FPGA 板 卡 上 运行 MIPSfpga， 需 要 采取 以 下 步骤 : 

。 步骤 1: 编写 一 个 FPGA 板 卡 的 Verilog 封装 文件 。 

© 步骤 2: 修改 MIPSfpga 的 内 存 大 小 (如 果 需 要 ) 。 

© 步骤 3: 创建 约束 文件 。 

(1) 步骤 1: 编写 一 个 FPGA 板 卡 的 Verilog 封装 文件 

Verilog 封装 文件 将 MIPSfpga 核心 连接 到 FPGA 板 卡 。 例 如 ，mipsfpga de2 115.v 是 
DE2-115 板 卡 的 封装 文件 ， 该 文件 使 用 板 上 LO 的 特定 名 称 连 接 MIPSfpga 核 和 具体 的 FPGA 
板 。 例 如 ，mipsfpga de2 115 模块 有 以 下 接口 : 


module mipsfpga de2 115 (input CLOCK_50, 
input [17:0] Sw, 
input [3:0] KEY, 
output [17:0] LEDR, 
output [ 8:0] LEDG, 
inout [6:0] EXT_IO); 


这 个 接口 连接 到 板 载 SOMHz 的 时 钟 (CLOCK_50) 、 开 关 (SW)、 按钮 (KEY) 、 红 色 和 绿色 
的 发 光 二 极 管 (LEDR 和 LEDG) 以 及 EJTAG 端口 (EXT_IO) 。 封 装 文件 (mipsfpga de2 115. 


v) 如 下 所 示 ， 将 MIPSfpga 核 (mipsfpga_sys ) 实 例 化 ， 将 FPGA 板 VO 连接 到 MIPSfpga 系统 
的 适当 1/0, 


mipsfpga_sys mipsfpga_sys ( 
.-SI_Reset_N(KEY[0]), 
-SI_ClkIn(CLOCK_50), 
.HADDR () ， 
.HRDRATRA ( ) ， 
. HWDATA ( ) ， 
-HWRITE(), 
-EJ_TRST_N_probe (EXT_IO[6]), 
-EJ_TDI(EXT_IO[5]), 
-EJ_TDO(EXT_IO[4]), 
-EJ TMS (EXT_IO[3]), 
. EJ_TCK (EXT_IO[2]), 
.-SI_ColdReset_N(EXT_IO[1]), 
.EJ_DINT (EXT_IO[0]), 
.10_Switch (SW), 
.10_PB({1'bO, ~KEY}), 
. IO_LEDR (LEDR), 
.IO_LEDG (LEDG) ) ; 


在 mipsfpga de2 115.v 封装 文件 中 , 输入 的 时 钟 频率 降低 了 ， 所 以 mipsfpga sys 
模块 接收 PLL( clk_out ) 的 输出 而 不 是 50MHz 的 时 钟 (CLOCK_50)。 

(2) 步骤 2: 修改 MIPSfpga 的 内 存 大 小 (如 果 需 要 ) 

有 些 FPGA 板 并 没有 足够 的 块 内 存 (block RAM) 来 容纳 目前 声明 的 128KB +256KB 内 存 。 
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因此 ， 和 需要 修改 mipsfpga ahb const.vh 文件 中 的 下 面 两 行 ， 以 便 更 改 内 存 大 小 : 


‘define H_RAM_RESET_ADDR_WIDTH (15) 
‘define H_RAM _ADDR_WIDTH (16 ) 


目前 ， 内 存 的 大 小 是 2 = 2) 字 节 = 128KB 的 复位 (引导 )RAM Al 2° 4 F =2" 字 节 = 
256KB 的 程序 RAM。 例 如 ，Xilinx 的 Basys3 板 卡 仅 有 225KB block RAM， 因 此 需要 修改 它 的 
mipsfpga ahb const. vh， 以 便 减 少 复位 和 程序 RAM 的 大 小 。 

(3) 步骤 3: 创建 约束 文件 

根据 新 的 FPGA 板 卡 规格 ,编写 (或 修改 ) 约 束 文件 ， 将 封装 模块 的 信号 名 称 映射 到 FPGA 
引 脚 并 指定 时 序 约束 。 

例如 ，DE2-115 板 卡 的 约束 文件 是 ; 


DE2_115.qsf // 映 射 封装 文件 的 信号 名 称 到 FPGA 引 脚 
mipsfpga_de2_115.sdc // 时 序 约束 
而 Nexys4 DDR 主板 的 约束 文件 是 : 


mipsfpga_nexys4_ddr.xdc // 将 信和 号 名 称 映 射 到 FPGA 板 卡 ,包括 时 序 约束 


在 Quartus II 或 Vivado 项目 中 ,你 需要 选择 正确 的 FPGA 作为 目标 设备 。 例 如 ， 对 于 Xilinx 
的 Nexys4 FPGA 板 卡 ， 目 标 FPGA 是 xc7al00tcsg324c-3， 而 Basys3 FPGA 板 卡 的 目标 FPGA 则 是 
xc7a35tcpg236c-3, 

完成 上 述 这 3 个 步骤 后 ， 执 行 以 下 操作 下 载 MIPSfpga 核 到 新 的 FPGA 板 卡 上 : 

1) 新 建 项 目 ( Vivado、Quartus II 等)。 

2) 添加 MIPSfpga 的 所 有 Verilog 文件 到 新 建 项 目 文 件 夹 。 

3) 使 用 在 上 述 步 又 1 中 创建 的 封装 文件 ， 而 不 是 MIPSfpga 原 有 的 mipsfpga de2 115.v 
或 mipsfpga nexys4 ddr.vo 
4) 使 用 修改 后 的 mipsfpga ahb const.vh 文件 (如 果 需 要 ) 。 
5 ) 添加 特定 于 对 应 板 卡 的 约束 文件 。 
6) 添加 PLL( 或 在 项 目 内 创建 一 个 新 的 ) ， 以 便 产 生 所 需 的 时 钟 频率 。 
7) 定位 到 目标 板 卡 的 FPGA。 
8) 编译 、 综 合 该 项 目 程序 ， 并 下 载 到 FPGA 板 卡 。 


D.6 Codescape 编程 


简单 程序 对 于 测试 MIPSfpga 的 基本 功能 是 有 效 的 。 但 是 ， 如 果 我 们 想 测试 MIPSfpga 系统 
的 更 高 级 功能 ( 比如 缓存 ) ， 就 需要 在 处 理 器 调用 用 户 程序 前 由 引导 程序 对 处 理 器 进行 初始 化 。 
本 节 将 介绍 如 何 使 用 Codescape MIPS SDK Essentials 软件 (以 下 简称 Codescape ) 在 MIPSfpga 处 理 
器 上 编译 和 运行 C 语言 和 MIPS 汇编 语言 程序 。Codescape 是 Imagination 公司 提供 的 一 款 免 费 的 
MIPSfpga SDK, 

除 此 之 外 ， 还 需要 使 用 OpenOCD 和 Bus Blaster 下 载 器 把 程序 下 载 到 MIPSfpga 系统 上 。 
OpenOCD 使 用 Codescape 上 的 源码 级 控制 台 调 试 器 gdb， 通 过 EJTAG 接口 在 MIPSfpga 核 上 下 载 
和 调试 程序 。 从 本 质 上 来 说 ，OpenOCD 是 gdb 和 下 载 器 之 间 的 软件 衔接 。OpenO0CD 还 有 几 个 
处 理 器 核心 特定 命令 ， 它 们 能 够 通过 gdb 的 “monitor” 命 令 在 gdb 上 操作 。 

Codescape 是 一 个 专门 为 MIPS 核心 而 设计 的 一 组 开源 gnu 编译 器 和 调试 器 (gcc 和 gdb)。 本 
节 将 说 明 如 何 : 

1) 使 用 Codescape 编译 C 和 MIPS 汇编 程序 。 
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2) 使 用 ModelSim 模拟 一 个 编译 后 的 程序 。 
3) 把 编译 后 的 程序 下 载 到 MIPSfpga 上 (两 种 方法 ): 
方法 1: 把 编译 后 的 程序 和 MIPSfpga 一 起 重新 综合 一 遍 。 
方法 2: 使 用 Bus Blaster 下 载 器 把 程序 下 载 到 MIPSfpga 上 。 
4) 在 MIPSfpga 核 上 实时 运行 调试 代码 。 


D. 6. 1 MIPSfpga 引导 代码 


到 现在 为 止 ， 本 文 只 在 没有 初始 化 的 MIPSfpga 核 上 运行 程序 。 这 对 于 那些 简单 的 程序 来 
说 是 可 接受 的 ,但 是 对 于 那些 需要 使 用 缓存 或 者 其 他 高 级 功能 的 程序 来 说 ， 就 需要 先 经 过 引导 
代码 的 初始 化 。 处 理 器 初始 化 完成 之 后 ， 引 导 代 码 会 跳 转 到 用 户 代 码 的 main 函数 去 执行 
程序 。 

引导 代码 通过 设置 寄存 器 和 初始 化 缓存 和 TLB 来 初始 化 MIPSfpga 核心 。 引 导 代 码 位 于 复位 
异常 地 址 ， 虚 拟 地 址 0xbfc00000 上 。 复 位 后 ，MIPSfpga 核心 就 从 这 个 地 址 上 开始 取 指 执行 (虚拟 
地 址 Oxbfc00000 = 物理 地 址 0xlfc00000 ) 。 引 导 代 码 文 件 包括 boot.S、init caches.S,init_ 
cp0.S, init gpr.S Minit tlb.S. boot.s 中 的 引导 代码 会 调用 其 他 几 个 文件 中 的 引导 代 
码 。5 引 导 代 码 主 要 通过 初始 化 下 面 几 个 部 分 来 为 MIPSfpga 核心 运行 用 户 程序 做 准备 : 

1) 协 处 理 器 0(boot .Ss 中 的 init cp0) 

2) TLB(init tlb) 

3) 指令 缓存 (init icache) 

4) 数据 缓存 (init dcache) 

初始 化 处 理 器 后 ， 引 导 代 码 调用 start 函数 来 进行 进一步 的 初始 化 ， 然 后 跳 转 到 用 户 程 
FFAS main 函数 。 


D.6.2 用 Codescape 编译 C 代码 和 汇编 代码 

本 节 主 要 介绍 如 何 使 用 Codescape MIPS SDK Essentials 来 编译 C 和 汇编 程序 。 

C 程序 示例 

示例 程序 D. 5 为 一 个 C 语言 程序 。 这 个 程序 对 应 于 按钮 的 输入 ， 除 了 有 一 个 默认 模式 外 ， 
它 还 有 3 个 运行 模式 。 当 按钮 3( DE2-115 板 卡 上 的 KEYL3] 和 Nexys4 DDR 板 卡 上 的 btnD ) 被 按 
下 时 ， 程 序 就 会 在 LED 灯 上 显示 递增 的 数值 。 当 按钮 2(KEY[2] 或 者 btnL) RFE FAY, LED 灯 
显示 递减 的 数值 。 当 按钮 1(KEYL1] 或 者 btnC ) 被 按 下 时 ，LED 灯 开 始 内 烁 。 如 果 没 有 按钮 被 
按 下 ，LED 灯 显 示 循 环 向 左 点 亮 的 一 组 4 个 LED 灯 。 

除了 典型 的 C 结构 外 ， 代 码 中 还 展示 了 如 何 添加 内 联 汇 编 代码 (inline assembly) 。 


示例 程序 D. 5 C 程序 示例 main.c 
#define inline assembly() asm("ori $0, $0, 0x1234") 
void delay(); 


int main() { 
volatile int *IO LEDR = (int*)0Oxbf800000; 
volatile int *IO PUSHBUTTONS = (int*)0Oxbf80000c; 


volatile unsigned int pushbutton, count = 0; 


while (1) { 
pushbutton = *IO PUSHBUTTONS; 
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switch (pushbutton) 1 


case 0X8 : count ++; break; 
case 0x4: count --; break; 
case 0x2: 

if (count ==0) count = ~count; 
else count = 0;，; 

break; 


default: if (count ==0) count = Oxf; 
else count = count << 1; 


} 


*IOQ LEDR = count;// write to red LEDs 
delay (); 
inline assembly (); 
} 
return 0; 


} 


注意 与 硬件 相关 的 任何 变量 ,比如 Pushbutton， 在 声明 时 其 前 面 必 须 加 上 volatile, 
这 样 就 不 会 被 编译 器 优化 掉 。delay 函数 中 的 循环 变量 j 也 声明 为 volatile， 所 以 它 也 不 会 
被 编译 需 优 化 掉 。 

为 了 编译 这 个 C 程序 ， 首 先 打开 CMD 窗口 (也 就 是 开始 菜单 中 的 cmd .exe)。 在 命令 提示 
符 处 进入 程序 相应 的 目录 下 ， 然 后 输入 : 


make 


这 将 使 用 Codescape 的 gec 和 Makefile Xf C 程序 进行 编译 。Makefile 会 生成 一 个 称 为 FPGA Ram. 
elf 的 ELF 文件 (Executable and Linkable Format， 可 执行 和 可 链接 格式 )。 通过 这 个 文件 和 
EJTAG 接口 Codescape 的 gdb 把 程序 下 载 到 MIPSfpga 核心 上 ， 将 在 D. 6.5 节 对 此 进行 详细 介绍 。 
FPGA Ram dasm.txt 文件 说 明了 穿插 了 汇编 或 C 语言 源 代码 的 反 汇 编 可 执行 代码 。 该 文件 
的 开头 部 分 列 出 了 从 虚拟 地 址 Ox9fc00000 开始 的 引导 代码 。 


LEAF (__reset_vector) 

la a2,__cpu_init 
9£c00000:3c069fc0 lui a2,0x9fc0 
9£c00004 :24c60014 addiu a2,a2,20 


虚拟 地 址 0x9fc00000 和 Oxbfc00000 都 会 映射 到 同一 个 物理 地 址 0xlfec00000。 所 以 在 复位 后 
地 址 0x9fc00000 的 指令 会 被 取出 来 。 这 两 个 地 址 的 不 同 之 处 在 于 ，0x9fc00000 位 于 可 缓存 的 
kseg0 ，0xbfc00000 的 ksegl 是 不 能 经 过 缓存 的 。 所 以 在 缓存 能 够 使 用 的 情况 下 把 引导 代码 放 在 
0x9fc00000 上 可 以 使 其 运行 得 更 快 一 些 。 文 件 的 后 面 从 地 址 0x8000075c 开始 的 都 是 用 户 的 代码 
(main.c)。 

int main() { 

8000075c:27bdffd8 addiu sp,sp, -40 

80000760 :afbf0024 sw ra,36 (sp) 


80000764 :afbe0020 sw s8,32 (sp) 
80000768 :03a0f021 move s8,sp 


另 一 个 可 读 版 ELF 文件 FPGA Ram modelsim.txt 说 明了 内 存 地 址 和 与 之 相对 应 的 机 器 
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代码 和 汇编 代码 ,但 没有 穿插 C 语言 或 汇编 源 代码 。 最 后 ， 你 可 以 在 命令 提示 符 处 输入 make 
clean 来 删除 这 些 编译 过 程 中 生成 的 文件 。 

MIPS 汇编 程序 示例 | 

示例 程序 D. 6 为 MIPS 汇编 程序 示例 。 这 其 实 就 是 示例 程序 D,3 的 Switches&LEDs 程 
Fe, 但 这 里 该 程序 将 会 与 引导 代码 一 起 进行 编译 ， 这 样 就 能 在 程序 执行 前 完成 处 理 器 初始 化 工 
作 。 回 顾 一 下 ，sSwitchesg&LEDs 程序 的 功能 是 不 断 地 从 FPGA 板 卡 读 取 拨 码 开关 和 按钮 的 
值 ， 然 后 显示 在 绿色 和 红色 LED 灯 上 。 


示例 程序 D. 6 MIPS 汇编 程序 示例 main.s 


# $10 = sw, $11 =pb 
. globl main 


main: 

lui $8, Oxbf80 

addiu $12, $8, 4 # $12 = LEDG address offset 
addiu $13, $8, 8 # $13 = SW address offset 
addiu $14, $8, Oxc # $14 = PB address offset 


readIO: 

lw $10,.0( $134 # read switches: sw = SW values 

lw $11, 0($14) # read pushbuttons: pb = PB values 

SW $10, 0($8) # write switch values to red LEDs 

SW $11, 0($12) # write pushbutton values to green LEDs 
beq $0, $0, readIO# repeat 

nop # branch delay slot 


为 了 编译 这 个 汇编 程序 ,首先 打开 CMD 窗口 ,在 命令 提示 符 处 进入 程序 对 应 的 目录 下 ,然后 
和 输入: 


make 


这 将 使 用 Codescape 的 gec( th. itt mips -mti -elf -gcc) 对 汇编 程序 进行 编译 。 与 前 面 的 C 
程序 一 样 ， 可 以 在 FPGA Ram dasm.txt 和 FPGA Ram modelsim.txt 文件 中 阅读 可 执行 文 
件 (FPGA _Ram.elf)， 也 可 以 在 命令 提示 符 处 使 用 make clean 来 删除 它们 。 


D. 6.3 编译 后 程序 模拟 


上 述 程序 编译 后 ， 可 以 使 用 ModelSim 来 进行 模拟 。 模 拟 过 程 分 为 以 下 3 步 : 

e。 步骤 1: 创建 MIPSfpga 内 存 初始 化 文件 (zam_ reset init .txt Ml ram_program_ 
LNLZELRG) 9 

© 步骤 2: 把 步骤 1 创建 的 文本 文件 复制 到 ModelSim 项 目 文件 夹 中 。 

e 步骤 3: 添加 Verilog 文件 到 项 目 中 ， 然 后 进行 模拟 。 


D. 6.4 结合 编译 后 程序 进行 MIPSfpga 硬件 重新 综合 


有 两 种 方法 在 FPGA 硬件 上 运行 编译 后 程序 。 第 一 种 方法 是 把 编译 好 的 新 引导 代码 和 指令 
代码 与 MIPSfpga 系统 一 起 重新 综合 ， 本 节 将 介绍 这 种 方法 。 第 二 种 方法 将 在 下 一 节 中 介绍 ， 
它 是 通过 EJTAG 接口 把 用 户 程序 和 引导 代码 下 载 到 MIPSfpga WE. BOA AKER, HU 
我 们 推荐 使 用 第 二 种 方法 。 

为 了 重新 综合 MIPSfpga 和 编译 后 程序 ， 首 先 要 按照 D. 6. 3 节 中 的 步骤 1 来 创建 初始 化 引 寻 
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RAM 和 程序 RAM 的 文本 文件 (ram reset init.txt 和 ram program init.txt)。 然 后 
把 这 两 个 文件 复制 到 MIPSfpga \ rtl_up 文件 夹 中 。 重 新 综合 整个 MIPSfpga 核心 ， 最 后 重新 下 载 
到 FPGA 板 上 。 


D. 6. 5 使 用 EJTAG 下 载 编译 后 程序 


本 节 将 使 用 Bus Blaster 下 载 器 ( 见 图 D-10) 和 EJTAG 接口 把 编译 后 程序 下 载 到 MIPSfpga 核 心 
上 。 通 过 把 USB 2. 0 高 速 电缆 输入 的 命令 转换 成 EJTAG 串 行 协议 ，Bus Blaster 下 载 器 把 编译 后 
程序 下 载 到 ii a òE, ypa hre 上 运行 的 程序 进行 控制 和 调试 。 





D-10 Bus Blaster 下 载 器 


通过 以 下 几 个 步骤 可 以 把 编译 后 程序 下 载 到 MIPSfpga 核 上 : 
e 步骤 1: 连接 Bus Blaster 下 载 器 。 

。 步骤 2: FÆ MIPSfpga 核 到 FPCA RE. 

o 步骤 3: 把 程序 下 载 到 MIPSfpga 核心 上 运行 。 

连接 Bus Blaster FZS 


把 Bus Blaster 下 载 器 插入 计算 机 和 FPGA 板 卡 。 首 先 使 用 提供 的 USB 编程 电缆 把 Bus Blaster 
下 载 器 和 计算 机 连接 起 来 。 接 下 来 就 使 用 扁平 电缆 把 Bus Blaster 下 载 器 与 FPGA 板 卡 连接 起 
来 。 如 果 使 用 DE2-155 板 卡 ， 则 可 以 直接 通过 扁平 电缆 把 Bus Blaster F a ard A iF EA 
EJTAG 接口 ， 如 图 D-11 所 示 。 如 果 使 用 Nexys4 DDR 板 卡 ， 则 需要 一 个 适 配 板 把 Bus Blaster 插 
大 板 卡 上 的 PMODB 接口 ， 如 图 D-12 所 示 。 





图 D-11 Bus Blaster 连接 到 DE2-115 FPGA 板 卡 图 D-12 Bus Blaster 连接 到 Nexys4 DDR FPGA 板 卡 


D.6.6 使 用 Codescape gdb 在 MIPSfpga 上 调试 编译 后 程序 


本 节 将 说 明 如 何 使 用 Codescape gdb 调试 MIPSfpga 上 实时 运行 的 程序 。 按 照 D. 5. 4 节 的 步 
又 用 Quartus II( 对 应 DE2-115 FPGA 板 卡 ) 或 者 Vivado( 对 应 Nexys4 DDR FPGA 板 卡 ) 把 MIPSfpga 
核心 下 载 到 FPGA 板 卡 上 ， 然 后 按照 D.6.5 节 的 步骤 把 对 应 程序 下 载 到 FPCA 板 卡 上 。 先 不 要 
关闭 loadMIPSfpga.bat 脚本 打开 的 OpenOCD 和 gdb 窗口 。 选 中 gdb 窗口 ( 带 有 mips-mti-elf- 
gdb 标签 的 ) ， 如 图 D-13 所 示 。 


Paes Ye 





va Ox80001bc0 


IS 
stion .rodata, size Gx4a4 lma 0x80001bd8g 
Loading section ,data, size 0x494 lma Oxs0002080 
Loading section ,sdata, size Oxc lma Ox80002518 
oading section ,bootrom, size OxHad Ima OxbfcO0000 
ress DxbfcQ0000 load size 10680 


rate: 45 KB/sec (62 butes/write 
mAUP cpu tap/device found: ob 40/010101010108 Mang be mmm Ob 4010)! art Ox0000, Ver 


图 D-13 正在 运行 gdb 的 命令 行 shell 


通过 OpenOCD gdb 与 MIPSfpga 核 进行 连接 。 在 loadMIPSfpga.bat 脚本 结束 时 ，gdb 会 
加 载 可 执行 文件 ( .elf)， 然 后 在 MIPSfpga 核 上 开始 运行 程序 。 下 面 是 gdb 中 一 些 比较 有 用 的 
命令 ， 它 们 可 以 用 来 调试 在 MIPSfpga 核心 上 实时 运行 的 程序 。 你 可 以 按照 表 D-5 中 的 顺序 在 
gdb 命令 行 中 输入 这 些 命令 来 体验 调试 的 过 程 。 


表 D-5 gdb 命令 
命令 描述 
停止 并 复位 处 理 器 ， 程 序 也 会 停止 运行 。 注 意 : gdb AY‘ monitor’ 命令 把 “reset halt’ 传 


monitor reset halt 送 到 OpenOCD 的 命令 解析 器 中 ， 然 后 才 执 行 复位 命令 
实际 应 用 时 ， 使 用 缩写 : mo reset halt 


给 主 程序 设置 一 个 断 点 (break main 的 缩写 ) 
主 函 数 开始 于 地 址 0x8000076c 


b main 


在 0x80000848 指令 地 址 上 设置 一 个 断 点 。 在 这 个 地 址 实例 C F (main. c) 对 应 的 指 
b * 0x80000848 令 为 写 红 色 LED 47: 
0x80000848 :ac430000 swv1,0 (v0) 


列 出 所 有 的 断 点 (info breakpoint 的 缩写 ) 。 经 过 前 面 几 步 之 后 ， 这 个 命令 会 列 出 前 面 所 


设置 的 两 个 断 点 0x8000076c(main) 、0x80000848 

- LEADER ae EEZ FF (continue 的 缩写 ) 。 这 个 命令 会 结束 第 一 个 断 点 ， 这 里 会 让 main 
程序 开始 执行 

c 让 处 理 器 继续 运行 (你 可 以 简单 地 按 下 enter 键 来 重复 执行 上 一 条 命令 ) 

p count 输出 count 变量 的 值 ( “print count” 的 缩写 ) 。 比 如 ， 现 在 count 的 值 为 15 

p/x count 以 十 六 进 制 形式 输出 count 变量 的 值 (0xf) 


p/x &count 输出 count 的 地 址 (0x8003ffb4 ) 
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( 续 ) 
命令 描述 

ir 输出 所 有 寄存 器 的 值 (info registers 的 缩写 ) 
irvl 只 输出 vi 寄存 器 的 值 ，v1 中 保存 的 是 地 址 0x80000848 上 的 ,sw 指令 写 人 LED 灯 的 值 (0xf) 
SR 输出 v0 寄存 器 的 值 ， 当 PC 为 0x80000848 时 ，v0 中 的 值 为 红色 LED 灯 的 地 
Ye hk: 0xbf800000 

继续 执行 程序 直到 下 一 个 断 点 (continue 的 缩写 ) 。sw 指令 执行 完成 后 ，LED 灯会 显 
J 示 Oxf 

输出 v1 寄存 器 的 值 ， 这 时 v1 中 的 值 已 经 左 移 了 工 位 ， 为 0xle。 重 复 前 面 两 条 命令 
irvl (c 和 了 ri) 来 继续 观察 count 左 移 。 在 你 继续 执行 程序 时 板 卡 上 亮 着 的 LED 灯 也 会 

随 着 左 移 
| 单 步 执行 一 条 指令 。 如 果 这 样 做 ， 你 就 会 发 现 PC 已 经 增加 到 了 0x8000084c 
stepi , 
“缩写 为 si 

dl 删除 断 点 1( 输 入 i b 列 出 所 有 的 断 点 和 对 应 的 号 ) 


复位 处 理 器 ， 在 复位 之 后 ， 之 前 设置 的 断 点 不 再 起 作用 


monitor reset run 
缩写 为 mo reset run 


K D-6 列 出 了 其 他 一 些 有 用 的 edb 命令 。 


表 D-6 其 他 gdb 命令 
命令 示例 /描述 


例 1; load FPGA_Ram.elf 

例 2: load:.\\AssemblyExample \\FPGA Ram.elf 

描述 ;把 可 执行 文件 (elf 文件 ) 加 载 到 MIPSfpga 核 上 

注意 :在 加 载 新 的 可 执行 文件 之 前 ,处 理 器 必须 是 处 于 停止 状态 
(mo reset halt) 。 在 加 载 后 ,还 要 再 输入 一 次 mo reset run 命 
令 来 运行 新 的 程序 


反 汇 编 指令 

例子 : 

disas Oxbfc00000, +100 ( +100 是 字 节 的 长 度 ) 

disas/m main( 反 汇编 混合 显示 mian 函数 的 源 代 码 和 汇编 

disas 代码 ) 

disas /r main (只 显示 指令 的 原始 字 节 ) 

注意 : 如 果 上 面 的 这 几 条 命令 都 不 管用 ( 比如 说 返回 的 是 nops ) ， 
那么 首先 停止 处 理 器 ， 然 后 输入 mo reset halt， 在 main 函数 处 
设置 一 个 断 点 (b main) ， 然 后 再 继续 运行 (ec) 。 最 后 再 使 用 上 面 的 


load <elf file name> 


命令 
x/i Oxbfc00000 检查 指令 一 一 类 似 于 disas 
set disassemble-next-line on |loff 如 果 为 on， 则 程序 停止 时 edb 就 显示 下 一 个 指令 的 反 汇 编 代码 
monitor mdw Oxbfc000000 16 
monitor mdw addr <#words> 描述 : 从 内 存 地 址 0xbfc000000 开始 读 16 个 字 的 内 存 内 容 。 默 认 


读 的 字数 为 1。 这 条 命令 只 能 在 处 理 器 停止 时 使 用 


monitor mww Oxbfc000000 Oxaaaaaaaa 
描述 : 写 0xaaaaaaaa 到 内 存 地 址 0xbfec00000。 它 只 有 在 处 理 器 停 
止 时 才 有 用 


描述 ; 在 没有 输入 任何 命令 的 情况 下 ， 按 下 回 车 键 会 重复 执行 一 
次 上 一 条 命令 


monitor mww addr word 


<return> 
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K D-7 列 出 了 一 些 可 以 在 gdb 中 运行 的 OpenOCD 命令 。 


表 D-7 gdb 中 运行 的 OQpenOCD 命令 
命令 示例 /描述 


monitor mips32 cp0 

描述 : 输出 所 有 协 处 理 器 0 中 寄存 器 中 的 值 
选项 ; 

regname: 寄存 器 名 字 

regnum: 寄存 器 号 

select: 寄存 器 选择 值 

value: 写 到 寄存 器 的 值 

例子 : monitor mips32 perfcnt0 Oxff 
E 0xff 到 perfcnt0 寄存 器 中 


monitor mips32 invalidate 


描述 : 在 有 写 回 或 者 没有 写 回 的 情况 下 ， 使 指令 和 数据 缓存 无 效 


monitor mips32 cp0 [[regname |regnum 
select] [value] ] 


选项 : 
monitor mips32 invalidate [all | all: 在 写 回 的 情况 下 使 指令 和 数据 缓存 都 无 效 
inst |data |allnowb | datanowb] inst: 在 写 回 的 情况 下 仅 让 指令 缓存 无 效 


data: 在 写 回 的 情况 下 仅 让 数据 缓存 无 效 
allnowb: 在 没有 写 回 的 情况 下 使 指令 和 数据 缓存 都 无 效 
datanowb: 在 没有 写 回 的 情况 下 使 数据 缓存 无 效 


monitor mips32 scan delay 3000 

描述 : 在 两 次 fastdata 写 之 间 添 加 延 时 。 它 在 写 MIPSfpga 核 时 非 
常 有 用 ( 比如 加 载 . elf 文件 时 )。 当 value 的 值 大 于 或 等 于 2000000 
时 ， 就 会 从 fastdata 模式 变 成 legacy 模式 


monitor version 打印 OpenOCD 服务 器 的 版 本 


monitor mips32 scan delay [value] 


D.7 总 结 与 展望 


通过 本 附录 的 学 习 ， 了 解 了 如 何在 FPGA 上 实现 MIPS 处 理 器 ; 并 对 MIPSfpga 核心 、 系 统 
架构 、 接 口 信号 以 及 怎么 在 MIPSfpga 上 仿真 代码 、 下 载 程序 、 运 行 和 调试 程序 等 都 有 了 基本 
的 认识 。MIPSfpga 作为 第 一 个 免费 的 商业 版 MIPS 核 ， 对 学 好 计算 机 体系 结构 、 髋 入 式 系 统 和 
片上 系统 设计 等 很 多 课程 都 很 有 帮助 。 此 外 ， 可 以 从 Imagination 公司 官网 下 载 更 多 关于 MIPSf- 
pga 的 资料 ， 帮 助 更 进一步 地 理解 MIPSfpga。 
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0, 22, 5 LOW, OFF 
1, 22, 4 HIGH, ON 
32-bit datapath(32 位 数据 通道 ) 461 
32-bit microprocessor( 32 {MARERE ), 454 
4004 microprocessor chip ( 4004 微 处 理 器 芯片 )， 
458, 459 
74xx series logic(74xx 系列 逻辑 电路 ) , 583-587 
parts ( 器 件 ) 
2: 1 mux(74157)(2: 1 复 用 器 ) 586 
3. 8 decoder(74138) (3: 8 解码 器 ) , 586 
4. 1 mux(74153)(4: 1 多 路 选择 器 ) 586 
AND(7408 ) (与 门 ) 585 
AND3(7411) (与 门 3) 585 
AND4(7421) (与 门 4) 585 
counter(74161 , 74163) (计数 器 ) ，586 
FLOP( 7474) (触发 器 ) ，583，585 
NAND(7400)( 与 非 门 )，585 
NOR(7402) (或 非 门 )，585 
NOT(7404) ( 非 门 ) ，583 
OR(7432) (或 门 ) 585 
register (74377 ) (寄存器) , 586 
tristate buffer( 74244) ( 三 态 缓冲 器 ) , 586 
XOR(7486) ( 异 或 门 ) 585 
80386 microprocessor chip ( 80386 微 处 理 需 芯片 ) ， 
459, 460 
80486 microprocessor chip ( 80486 微 处 理 器 芯片 )， 
460，461 
#define, 627-628 
#include, 4% JL Standard libraries, 628-629 


A 


Abstraction( 抽象 ) 4-5 

digital ( 数字 ) 4 JIL Digital abstraction 
Accumulator( 累加 器 ) , 353 
Acquisition time( 采 集 时 间 ) 4 IL Sampling time 
Active low( 低 电 平 有 效 ) , 74-75 


A/D conversion( 模拟 数字 转换 ) , 531-533 
registers in( 寄存 器 人 ) ，532 
ADC( 模 拟 数 字 电 路 ) ， 另 见 Analog/digital converter 
add, 297 
Adder( 加 法 器 ) , 239-246 
carry- lookahead ( 先行 进位 ) 241 
carry propagate ( 进位 传播 ) 240 
full(4=) , 56, 240 
half( 半 ) , 240 
HDL for( 硬件 描述 语言 ) 184, 200 
prefix( 前 级 ) , 243 
ripple-carry( 行 波 进位 ) ，240 
addi, 304 
addiu, 345 
addu, 345 
Addition (加 法 )， 另 见 Adders, 14-15, 17- 18, 
235, 239-246, 297 
Binary( 二 进 制 ) 14-15 
floating point( 浮上 点 数 ) , 258-259 
MIPS instruction( MIPS 指令 ) , 344-345, 622 
signed binary( 带 符号 二 进 制 数 ) 15-17 
Address( 地 址 ) 另 见 Memory 
physical( 物理 ) , 497-501 
translation ( 转换 ) , 497-500 
virtual ( 虚拟 ) 另 见 Virtual memory, 497 
Addressing mode ( 寻 址 方式 ) 
MIPS( 每 秒 百 万 条 指令 ) , 333-335 
base( 基 址 ) ，333 
immediate( 立即 数 ) ，333 
PC-relative( PC 相对 ) ，333-334 
pseudo- direct( 伪 直 接 ) , 334-335 
register- only( 寄存 器 ) , 333 
x86, 349 
Advanced Micro Devices ( AMD ), 296, 375, 
457, 460 
Advanced microarchitecture( 先进 微 结 构 ) , 444-458 


xe S 


branch prediction ( 分支 预 测 )， 另 见 Branch pre- 
diction 
deep pipeline( 深度 流水 线 ) ， 另 见 Deep pipelines 
heterogeneous multiprocessor( 异 构 多 处 理 器 ) ， 另 
见 Heterogeneous multiprocessors 
homogeneous multiprocessor ( 同 构 型 多 处 理 器 ) , 
另 见 Homogeneous multiprocessor 
multithreading( 多 线程 ) ， 另 见 Multithreading 
out-of-order processor ( 5 26 Ab PEAS), 4% 3 Out- 
of- order processor 
registerrenaming ( 重 命名 寄存 器 )， 另 见 Regis- 
terrenaming 
single instruction multiple data ( 单 指令 多 数据 
L), A JL Single Instruction Multiple Data 
superscalar processor ( 超标 量 处 理 器 ) ， 另 见 Su- 
perscalar processor 
Altera FPGA ( Altera 现场 可 编程 逻辑 门 阵列 )， 
274-279 
ALU( BARE HI), A IL Arithmetic/logical unit 
ALU decoder( ALU 译 码 器 ) , 382-384 
HDL for( 硬件 描述 语言 ) 432 
ALUControl, 378, 384 
ALUOp, 382-384 
ALUResult, 378 
ALUSre, 384 
ALUSreA, 397 
ALUSrcB, 397 
AMAT( 平 均 内 存 访 问 时 间 ) ， 另 见 Average memory 
access time 
AMD ， 另 见 Advanced Micro Device 
Amdahl, Gene, 480 
Amdahl’ s Law( Amdahl 定律 ) 480 
American Standard Code for Information Interchange 
(ASCII, 美国 信息 交换 标准 码 )，322，323， 
630, 649-650 
Analog LO( 模 拟 1/0) , 531-537 
A/D conversion ( 模拟 /数字 转换 ) , 532-533 
D/A conversion ( 数字 /模拟 转换 ) , 533-537 
Pulse- Width Modulation( PWM, hkh S% BE yat), 
536-537 
Analog- to- Digital Converter( ADC, $ M A = 44 th 
fir), 531-533 
Analytical engine( 分 析 机 ) 7, 8 
AND gate( 与 门 ) 20-22, 179 
chips(7408, 7411, 7421) (芯片 ) 585 
truth table( 真 值 表 ) 20, 22 
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using CMOS transistor (使 用 CMOS 晶体 管 )， 
32-33 
and, 311 
andi, 311-312 
AND-OR( AO) gate( 与 或 门 ) 46 
Anode( 阳极 )，27 
Application- specific integrated circuit( ASIC， 专 用 集 
成 电路 ) , 591 
Architectural state( 体系 机 构 状 态 ) 310, 371-372 
Architecture( 体系 结构 ) , 295-356, 619-622 
MIPS( 每 秒 百 万 指令 ) 
addressing mode( 寻 址 方式 ) ，333-335 
assembly language( 汇编 语言 )，296-304，619-622 
instructions( 指令 ) ，619-622 
machine language( 机 器 语言 ) 305-310 
operand ( 操作 数 ) ，298-304 
x86, 347-356 
Arguments( 参数 ) , 326, 332-333, 637 
pass by reference( 按 引用 传递 ) 644 
pass by value( 按 值 传 递 ) 644 
Arithmetic( 算术 ) 
C operators( C 运算 符 ) ，633-635 
circuits( 电路 ) ，239-254 
HDL operators( HDL 运算 符 ) ，185 
MIPS instructions( MIPS 指令 ) ，310-314 
packed( 封 装 ) , 454 
Arithmetic/Logical Unit ( ALU, 算术 逻辑 单元 )， 
248-250, 378 
implementation of( 实现 ) 249 
in MIPS processor (在 MIPS 处 理 器 中 ),， 另 见 
ALUControl, ALUOp, 382-385 
Arrays( 数组 ) , 320-324, 645-651 
accessing( 访问 ) , 320-322, 645 
as input argument( 作为 输入 参数 ) 646-647 
bytes and characters ( 字 节 和 字符 ) 322-324, 
649-651 
comparison or assignment of ( 比较 或 赋值 ) 650 
declaration ( 声明 ) , 645 
indexing( 索引) , 320-322, 645-649 
initialization ( 初始 化 )，645-646 
multi- dimension( 多 维度 ，648-649 ) 
ASCII ( 美国 标准 信息 交换 码 )， 另 见 American 
Standard Code for Information Interchange 
ASIC( 专用 集成 电路 ) ， 另 见 Application- specific 
integrated circuit 
Assembler( 汇编 器 ) , 338-339, 666 


456 


Assembler directives( 汇编 器 指令 ) , 338 
Assembler temporary register( Sat, Ya arim AY a 
FAR), 342 
Assembly language, MIPS( 汇编 语言 ， 每 秒 百 万 指 
令 ) ， 另 见 MIPS instruction, 295-356, 619-622 
instruction( ##4) , 296-304, 619-622 
logical instruction( 逻辑 指令 ) , 311-312 
operand ( 操作 数 ) , 298-304 
translating high-level code into ( 转换 高 级 语言 代 
码 为 ) 300 
translating machine language to (转换 机 器 语言 
为 )，309 
translating to machine language (转换 为 机 器 语 
言 )，306-307 
Assembly language, x86 ( 汇编 语言 ，x86)， 另 见 
x86 instruction 
Associativity ( 结合 律 ) 
in Boolean algebra( 在 布尔 代数 中 ) ，62 ，63 
in caches( 在 缓存 中 ) 481, 486-488 
Astable circuits( 非 稳 态 电 路 ) 119 
Asymmetric multiprocessors ( 非 对称 多 处 理 器 ) ， 另 
见 Heterogeneous multiprocessors 
Asynchronous circuits( 异步 电路 ) ，120-123 
Asynchronous resettable flip- flops definition ( 异步 复 
位 触发 絮 定 义 )，116 
HDL( 硬件 描述 语言 )，194-196 
Asynchronous serial link( 异步 串 行 链 路 ) ， 另 见 U- 
niversal Asynchronous 
(UART) , 522 
AT Attachment( ATA, AT 附件 ) 562 
Average Memory Access Time( AMAT, 平均 内 存 访 
问 时 间 ) , 479, 492 


Receiver Transmitter 
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Babbage, Charles, 7 

Base address( 基 址 ) , 301-302, 307, 320-322, 324 

Base addressing ( 基 址 寻 址 ) 333 

Baud Rate Register( BRG， 波 特 率 寄存 器 ) ，518 

BCD( 二 进 制 编码 的 十 进 制 数 )， 另 见 Binary 
coded decimal 

Behavioral modeling( 行为 建 模 ) 173-174 

Benchmark( 基准 测试 程序 ) ，375 

een) 9140315 

Biased exponent ( 偏 移 阶 码 ) , 257 

Big- endian memory( 大 端 存 储 器 ) , 302-303 


Big-endian order( 大 端 顺序 ) 178 

Binary addition( 二 进 制 加 法 ) ， 另 见 Adder, Addi- 
tion, 14-15 

Binary Coded Decimal( BCD ， 二 进 制 编码 的 十 进 制 
数 ) 258 

Binary encoding( 二进制 编码 ) 125-126, 129-131 
for divide-by-3 counter( 除 以 3 if eet) , 129-131 
for traffic light FSM ( 2¢ i KT E BR AR AS BL), 

125-126 

Binary number( 二 进 数 ) 
signed( 有 符号 ) 15-19 
unsigned( 无 符号 ) 9-11 

Binary to decimal conversion (二 -十进制 转换 )， 
10, 10 -11 

Binary to hexadecimal conversion ( 二 - 十 六 进 制 转 
换 ) ，12 

Bipolar junction transistor( 双 极 性 晶体管 ) 26 

Bipolar motor drive( 双 极 性 电机 驱动 )，555 

Bipolar signaling( 双 极 性 信号 )，524 

Bipolar stepper motor ( 双 极 性 步 进 电机 )，554， 
554-555 
AIRPAX LB82773-M1, 554, 555 
direct drive current( 直流 驱动 电流 ) 556 

Bistable element ( 双 稳 态 元 件 ) 109 

Bit( 位 ) 8 

dirty( HÈ) , 494 
least significant ( 最 低 有 效 ) 13, 14 
most significant ( RAAZ), 13, 14 
sign( 有 符号 ) 16 
use( 使 用 ) ，490 
valid( 有 效 ) ，484 

Bit cell( 位 元 ) ，264-269 
DRAM( 动态 随机 存储 器 ) 266-267 
ROM( 只 读 存 储 器 ) 268-269 
SRAM (静态 随机 存储 器 ) 267 

Bitline( 位 线 ) 264 

Bit swizzling( 位 交叉 混合 ) ，188 

Bitwise operator( 位 运算 符 ) ，177-179 

Block( 4), 481 

Block offset ( Amg ), 488-489 

Block size(b, K/N), 481, 488-489 

Blocking and nonblocking assignment ( BH 3 #1 JE BA SE 
赋值 ) 199-200, 205-209 

BlueSMiRF silver module ( BlueSMiRF silver 模块 ) , 
548, 548 

Bluetooth wireless communication ( 蓝牙 无 线 通 信 ) , 
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547-548 
BlueSMiRF silver module ( BlueSMiRF silver 模 
H), 548 
class( %5) ), 547 
PIC32 to PC link(PIC32 与 PC 链接 ) 548 
bne，314-315 
Boole, George, 8 
Boolean algebra( 布尔 代数 ) , 60-66 
axiom( 公理 ) 61 
equation simplification ( 等 式 简化 ) 65-66 
theorem( 定理 ) , 61-64 
Boolean equation ( #i 7K |x) , 58-60 
Product- Of- Sum( POS) form( 8% 45 (POS) x) , 60 
Sum- Of- Product ( SOP ) form (与 或 ( SOP) xt), 
58-60 
Boolean logic ( #f 75 1% $), 4 WL Boolean algebra, 
Logic gate, 8 
Boolean theorem( 布尔 定理 ) 61-64 
associativity ( 结合 律 ) 63 
combining( 合 并 律 ) 62 
complement( 互补 定理 ) 62 
consensus ( 一 致 律 ) 62, 64 
covering( 吸收 律 ) ，62 
De Morgans( 德 ， 摩根 定理 ) 63-64 
distributivity( 分 布 律 ) ，63 
idempotency( HÆ), 62 
identity ( 同一 性 定理 ) , 62 
involution( 回旋 和 定理) , 62 
null element( JCEM), 62 
Branch( 分支 )，384 
Branch equal( beq) 
machine code for( 机 器 代码 ) , 334 
processor implementations of ( 处 理 器 实现 ) 381- 
382, 395-396, 401-402 
Branch hazard( 分 支 冲突 ) , 3% IL Control hazard 
Branch misprediction penalty ( 分 支 错 误 预 测 惩 罚 ) , 
421-422 
Branch prediction (分支 预测 ) , 446-447 
Branch target address( BTA ， 分 支 目标 地 址 ) 333- 
334, 381 
Branch target buffer( 分 支 目 标 缓冲 硕 ) , 446 
Branching( 分 支 ) 
conditional( 有 条 件 )，314-315 
unconditional( jump ， 无 条 件 ) ，315-316 
Breadboard( 电路 试验 板 ) ，600-601 
BTA( 分 支 目 标 地 址 ) ， 另 见 Branch target address 
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Bubble( 7), 20, 63, 419 
pushing( #£) , 63-64, 71-73 
Buffers ( 缓冲 器 ) , 20 
lack of ( 缺少 ) 117 
tristate( 三 态 门 ) , 74-75 
Bug( 程序 错误 ) , 175 
in C code(C 代码 ) ，667-671 
Bus( 总 线 ) 56 
tristate( =Æ), 75 
Bypassing( 绕 过 ) ， 另 见 Forwarding, 416 
Byte( 字 节 ) ， 另 见 Character，13-14 ，322-324 
least significant( 最 低 有 效 ) ，13-14 
most significant( 最 高 有 效 ) 13-14 
Byte- addressable memory ( 字 节 寻 址 存储 器 )， 
301-303 
big-endian( Ki ) , 302-303 
little- endian ( 小 端 ) , 302-303 
Byte offset( 字 节 偏 移 ) 483 


C 


C programming( C 语言 编程 ) 623-671 
common mistake (常见 错误 )， 另 见 
Common mistake 
compilation( 编译 ) ， 另 见 Compilation 
conditional statement( 条 件 语 句 ) ， 另 见 Condi- 
tional statement 
control- flow statement ( 控制 流 语句 )， 另 见 
Controlflow statement 
data type( 数据 类 型 ) ， 另 见 Data type 
function call( ek SCya FA ) 4 UL Function call 
loop( 循 环 ) , 4% JL Loop 
operator( 操作 符 ) , 7 JL Operator 
running( 运行 ) 626 
simple program( 简单 程序 ) 625-626 
standard library ( 标准 库 ) , 34 JL Standardlibrary 
variable( 变量 ) ， 另 见 Variable 
Cache( 缓存 ) ，480-495 
address field( 地 址 域 ) 
block offset( 块 偏 移 ) ，488-489 
byte offset( 字 节 偏 移 ) ，483 
set bit( 设置 位 ) 483 
tag( 标签) 483 | 
advanced design( 先进 设计 ) , 491-495 
evolution of, in MIPS( 演 化 ，MIPS A), 495 
multiple level( 多 层次 ) 492 
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nonblocking( 4EBH 2) , 566 
organization( 组织 方式 )，490 
direct mapped( 直接 映射 ) ，482-486 
fully associative( 全 关联 ) , 487-488 
multiway set associative (多 路 设置 关联 )， 
486-487 
parameter( 参数 ) 
block( 块 ) 481 
block size( 块 大 小 ) 481, 488-489 
capacity(C， 容 量 ) ，480-481 
degree of associativity(N， 关 联 度 ) ，486 
number of set(S， 和 集 数 ) 481 
performance of( 性 能 ) 
hit( 命中 ) ，478-480 
hit rate( 命中 率 ) 478-480 
miss( 缺失 ) ，478-480 ，493 
capacity( 容量 ) ，493 
compulsory ( 强制 ) ，493 
conflict( 冲突 ) , 486, 493 
penalty ( 惩罚 ) , 488 
miss rate( 缺失 率 ) , 478-480 
reducing ( 降低 ) , 493-494 
miss rate vs. cache parameter ( 缺失 率 与 缓存 
参数 ) , 493-494 
replacement policy ( 蔡 策 略 ) , 490-491 
status bits( 状态 位 ) 
dirty bit(D， 脏 位 ) ，494 
use bit(U， 使 用 位 ) 490 
valid bit(V， 有 效 位 ) ，484 
write policy( 写 人 策略 ) 494-495 
write-back( 写 回 ) ，494-495 
write-through( 直 写 ) ，494-495 
CAD( 计算 机 辅助 设计 ) ， 另 见 Computer- aided de- 
sign 
Callee- saved register (被 调用 函数 保存 的 寄存 
9 
Canonical form( 范式 ) ， 另 见 Sum-of-product，Prod- 
uct- of- sum 
Capacitor( 电容 ) 28 
Capacity, of cache( RAFAH) , 480-481 
Capacity miss( 容量 缺失 ) , 493 
Carry Propagate Adder ( CPA, HIE 7G DIE AR), 
另 见 Ripple- carry adder, Carry- lookahed adder, 
and Prefix adder 
Carry- Lookahead Adder( CLA， 先 行进 位 加 法 需 ) , 
241-243 ，242 
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Case statement, in HDL( case 语句 , 在 HDL 中 )， 
另 见 switch/case statement, 201-203 
Casez, case?, in HDL ( casez, case? 语句 ， 在 
HDL 中 ) , 205 
Cathode( 阴极 ) , 27 
Cathode Ray Tube(CRT， 阴 极 射线 管 ) ， 另 见 VGA 
monitor, VGA, 541-542 
horizontal blanking interval ( 水 平 消 隐 间隔 )，542 
vertical blanking interval ( 垂直 消 隐 间隔 ) 542 
Cause register( cause AITAS), 343-344, 441 
Character LCD( #% LCD), 538-541 
Character(char, #4), 322-324, 630, 649 
array( 数组 ) ， 另 见 String, 322-324 
C type(C 类 型 ) 649 
Chip( 芯片 ) 28 
multiprocessor( 多 处 理 需 ) ，456 
Chopper constant current drive ( $f Y fH yi 3K 
动 ) 556 
Circuit ( 电路 ) 
74xx series(74xx 系列 ) ， 另 见 74xx series logic 
application- specific integrated( ASIC ， 专 用 集成 电 
路 ) 591 
astable( 非 稳 态 ) 119 
asynchronous( 异步 ) 120, 122-123 
combinational( 组 合 ) ， 另 见 Combinational logic 
definition of( ŒX), 55 
delay( HEIR) , 88-92 
multiple-output ( 多 路 输出 ) , 68 
priority ( 优先 级 ) 68 
sequential (AY Fe), 4 JL Sequential logic 
synchronous( 同步 ) , 122-123 
synchronous sequential ( 同步 时 序 电 路 )，120- 
123, 122 
synthesized( 综合) 176, 179, 181 
timing( AY FF) , 88-95 
with two-stage pipeline( 两 级 流水 线 ) 160 
without glitch( 无 毛刺 ) , 95 
CISC( 复杂 指令 集 计 算 机 ) , AIL Complex Instruc- ` 
tion Set Computer 
CLB( 可 配置 逻辑 块 ) ， 另 见 Configurable logic block 
Clock cycles per instruction ( CPI， 每 条 指令 的 时 钟 
周期 ) ，444 ，446 
Clock period( 时 钟 周 期 ) 142, 376 
Clock skew( 时 钟 偏 斜 ) , 148-151 
Clustered multiprocessing( 集群 多 处 理 ) , 456 
CMOS( 互 补 氧 化 物 半 导体 ) ， 另 见 Complementary 
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MetalOxide- Semiconductor Logic 
Combinational composition ( 组 合 电路 构建 ) 56 
Combinational logic( 组 合 逻 辑 ) 174 
design( 设 计 ) , 55-106 
Boolean algebra( 布尔 代数 ) ，60-66 
Boolean equation( 布尔 等 式 ) ，58-60 
building block( 构 造 部 件 ) , 83-88, 239-254 
delay( 延 时 ) , 88-92 
don’ t cares( 无 关 项 ) 81-82 
Karnaugh map( K-map， 卡 诺 图 ) ，75-83 
multilevel( 多 层 ) ，66-73 
precedence( 优先 级 ) 58 
timing( 上 时序) ，88-95 
two-level( WJZ), 69 
X’ s( contention, X($)), 5 IL Conten- 
tion 


X’ s(don’ t cares, X( 无关 项 ) ) ， 另 见 Don' t 


cares( X) 
Z’ s( floating) ( Z(4&k&2)), 5 A Floating 
(Z) 


HDL and( 硬件 描述 语言 ) 4% JI Hardware de- 
scription language 
truth table with don’ t cares( 具有 无 关 项 的 真 值 
表 ) ，69，81-82 ，205 
Combining theorem( 合并 律 ) 62 
Command line argument ( 命令 行 参 数 ) , 666-667 
Comments( 注释 ) 
in C(C ita), 627 
in MIPS assembly( 在 MIPS 汇编 语言 ) 297 
in SystemVerilog( 在 SystemVerilog 语言 ) ，180 
in VHDL( 在 VHDL 语言 ) 180 
Common mistake in C(C 语言 中 的 常见 错误 )， 
667-671 
Comparator( 比较 器 ) ，246-248 
Comparison( 比较 ) 
in hardware( 在 硬件 中 ) ， 另 见 Comparator，ALU 
in MIPS assembly( 在 MIPS 汇编 语言 中 ) 319- 
320, 345 
using ALU( 使 用 ALU), 250 
Compilation, in C (C if & fa HE), 626- 627, 
665-666 
Compiler( 编译 器 ) , 338-339 
for C(C 语言 ) 626-627, 665-666 
Complementary Metal- OxideSemiconductor Logic 
(CM0S， 互 补 金属 氧化 物 半 导体 逻辑 ) 26-34 
Complement theorem( 互补 定理 ) ，62 
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Complex instruction set computer( CISC, HAHO EE 
计算 机 ) 298, 347 
Complexity management( 复杂 度 管理 )，4-7 
digital abstraction( 数字 抽象 ) 4-5 
discipline( 约束 ) , 5-6 
hierarchy( 层 次 化 ) , 6-7 
modularity ( 模块 化 ) ，6-7 
regularity( 规整 化 ) ，6-7 
Compulsory miss( 强制 缺失 ) ，493 
Computer Architecture( Hennessy&Patterson ， 计 算 机 
体系 结构 ) 444 
Computer-aided design( CAD, 计算 机 辅助 设计 )， 
71, 129 
Concurrent signal assignment statement ( 并 行 信号 赋 
值 语 句 ) 179, 183-184, 193, 200-206 
Condition code( 条件 码 ) ， 另 见 Status flags 
Conditional assignment( 条 件 赋值 ) ，181-182 
Conditional branch( 条 件 分 支 ) 314-315 
Conditional operator( 条 件 运算 符 ) ，181-182 
Conditional signal assignment ( 条件 信 号 赋值 )， 
181-182 
Conditional statement( 条 件 语 句 ) 
in C( 在 C 语 言 中 )，639-640 
if, 639-640 
if/else, 639 
switch/case, 639-640 
in HDL( # HDL 中 ) 194, 201-205 
case, 201-203 
casez, case?, 205 
if, if/else, 202-205 
in MIPS assembly( 在 MIPS 汇编 中 ) , 316-317 
if, 316-317 
if/else, 317 
switch/case, 317 
Configurable Logic Block (CLB， 可 配置 逻辑 块 )， 
另 见 Logic element, 274, 589 
Conflict miss( 冲突 缺失 ) , 493 
Consensus theorem( 一 致 律 ) 62, 64 
Constant ( 常数 ) 
in C( Æ C 中 ) 627-628 
in MIPS assembly( 在 MIPS 汇编 中 ) ， 另 见 Imme- 
diate，304，313 
Contamination delay ( 最 小 延迟 ) ， 另 见 Short path, 
88-92 
Contention(X, $$), 73-74 
Context switching( 上 下 文 切换 ) 455 
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Continuous assignment statement ( 连续 赋值 语句 )， 
179, 193, 200, 206 
Control hazard ( 控制 冲突 ) , 415, 421-424 
Control signal ( 控制 信号 ) , 91, 249 
Control unit (控制 单元 )， 另 见 ALU decoder, 
Main decoder 
of multicycle MIPS processor( 多 周期 MIPS 处 理 
ft), 396-408 
of pipelined MIPS processor ( jit 7k 2& MIPS 处 理 
器 ) 413-414 
of single-cycle MIPS processor ( 单 周 期 MIPS 处 理 
器 ) ，382-387 
Control-flow statement ( 控制 流 语句 ) 
conditional statement ( 条 件 语 句 )， 另 见 Condi- 
tional statements 
loop( 循环 ) ， 另 见 Loop 
Coprocessor 0 register( HAR FEAF 0 AITA), JI 
Cause and EPC, 441 
Core Duo microprocessor chip ( fi Z IIZ GAL FH AE U 
Fr), 464 
Core i7 microprocessor chip ( fi Z i7 fit Wb IE AE ath 
Fr), 465 
Core( 4%) , 456 
Counter( 计数 器 ) , 260 
divide- by-3 (RUA 3) , 130 
Covering theorem( 吸收 律 ) 62 
CPA ( 进位 传播 加 法 器 )， 另 见 Carry propagate ad- 
der( CPA) 
CPI( 每 条 指令 的 时 钟 周期 ) ， 另 见 Clock cycles per 
instruction, Cycles per instruction 
Critical path( 关 健 路 径 ) , 89-92, 388 
Cross- coupled inverter (ZX LHE RHAH), 
109, 110 
bistable operation of 双 稳 态 运 作 ) , 110 
CRT( 阴极 射线 管 ) ， 另 见 Cathode ray tube 
Cycle time( 周期 时 间 ) ， 另 见 Clock period 
Cycles per instruction(CPI， 每 条 指令 的 时 钟 周期 , 
375 
Cyclic path( 回路 ) ，120 
Cyclone IV FPGA( Cyclone IV 现场 可 编程 逻辑 门 阵 
列 ) 274-279 
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D flip-flop(D 触发 器 ) , % JL flip-flops 
D latch( D 锁 存 器 ) ， 另 见 Latch 


D/A conversion( D/A 转换 ) , 533-537 
DAC ( 3 F R HU Fe PR at), A 见 Digital- to- 
analog converter 
Data Acquisition System ( DAQ， 数 据 采 集 系 统 )， 
562-563 
myDAQ, 563 
Data hazard ( 数据 冲突 ) , 415-421 
Data memory ( 数据 存储 器 ) , 373 
HDL for( 便 件 描述 语言 ) 439 
Data segment( 数据 段 ) 340 
Data sheet( 数据 手册 ) , 591-596 
Data type( 数据 类 型 )，643-657 
array( 数 组 ) ， 另 见 Array 
character( 字 符 ) ， 另 见 Character( char) 
dynamic memory allocation (动态 内 存 分 配 )， 另 
见 Dynamic memory allocation( malloc and free ) 
linked list( 链表 ) , % JL Linked list 
pointer( 指针 ) , 4% JL Pointer 
string( 字符 串 ) ， 另 见 String( str) 
structure( 结构 ) ， 另 见 Structure( struct) 
typedef, 653-654 
Datapath ( 数据 通路 ) 
multicycle MIPS processor( 多 周期 MIPS 处 理 需 ) , 
390-396 
pipelined MIPS processor( 流水 线 MIPS Ab FHF) , 
412-413 
single- cycle MIPS processor ( 单 周 期 MIPS 处 理 
ft), 376-382 
DC( 直流 电 ) ， 另 见 Direct current 
DC motor( 直流 电机 ) , 548-552, 549 
H-bridge(H 桥 ) 549, 550 
shaft encoder( 轴 角 编码 器 ) , 549-552 
DC transfer characteristics ( 直流 传输 特性 ) ， 另 见 
Noise margin , 24-26 
DDR3( 双 数据 数 率 内 存 3), 5 I Double- data 
rate memory 
DE-9 cable( DE-9 缓存 ) 524 
De Morgan’s theorem( $ - 摩根 定理 ) 63 
Decimal number( 十 进 制 数 ) 9 
Decimal to binary conversion ( 十 进 制 — 二 进 制 转 
换 ) 11 
Decimal to hexadecimal conversion( 十 进 制 — 十 六 进 
制 转换 ) ，13 
Decode stage( 详 码 阶段 ) 409-411 
Decoder( 译 码 器 ) 
definition of( 7 SZ), 86-87 
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HDL for( 硬件 描述 语言 
behavioral( 行为 )，202-203 
parameterized( 参数 化 ) , 219 
logic using( 人 逻辑 使 用 ) 87-88 
Seven- segment(7 Ez ib aS PEGG HS), A JL Seven- 
segment display decoder 
Deep pipeline ( 深度 流水 线 ) , 444-445 
Delay generation using counters ( 使 用 计数 器 产生 延 
WR), 528-529 
Delaymicros function( Delaymicros PKI% ) , 528 
Delays, logic gate( HEAT, i 41]), A JL Propaga- 
tion delay 
in HDL (simulation only ) (在 HDL 中 (只 能 模 
#1) ), 188-189 
DeleteUser function( DeleteUser 因数 ) , 655 
De Morgan, Augustus, 63 
De Morgan’ s theorem( $ - 摩根 定理 ) , 63-64 
Dennard, Robert, 266 
Destination register(rd 或 rt， 目 的 地 寄存 器 ) , 378- 
379, 385, 393 
Device driver( i SK ah FEF) , 507-508, 526 
Device under test( DUT， 测 试 设备 ) 220 
Dice( 切 块 ) 28 
Dielectric( 电介质 ) 28 
Digital abstraction( 数字 抽象 ) 4-5, 7-9, 22-26 
Digital circuit( 数字 电路 ) ， 另 见 Logic 
Digital signal processor(DSP， 数 字 信 和 号 处 理 ) , 457 
Digital system implementation ( 数字 系统 实现 ) ，583- 
617 
74xx series logic (74xx % Fl) i Ht PR), 5I 
74xx series logic 
application- specific integrated circuits( ASIC, FA 
集成 电路 ) , 591 
assembly of( 汇编 语言 ) 599-602 
breadboard ( 电路 试验 板 ) , 600-601 
data sheet ( 数据 手册 ) , 591-596 
economics( 经 济 学 ) , 615-617 
logic family ( 逻辑 电路 系列 ) , 597-599 
packaging ( 封装) , 599-602 
printed circuit board( 印刷 电路 板 ) , 601-602 
programmable logic( 可 编程 逻辑 ) , 584-591 
Digital- to- analog converter (DAC， 数 字模 拟 转 换 
BR) ，531 
DIMM( 双 列 直 捅 内 存 模块 )， 另 见 Dual inline 


memory module 


Diodes( 二极管 ) 27-28 
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p-n junction( p-n 接 面 ) 28 
DIP( IJ HERH), 5 I Dual-inline package 
Direct current ( DC ) transfer characteristics ( 直流 电 
(DC ) 传 输 特 性 ) , 24, 25 
Direct mapped cache( 直接 映射 缓存 )，482-486，484 
Direct voltage drive( 直流 电压 驱动 )，554 
Dirty bit( D， 重 写 标志 位 )，494 
Discipline( 约束 ) 
dynamic( BAS) ， 另 见 Timing analysis, 142-151 
static( 静态 ) ， 另 见 Noise margin, 142-151 
Discrete-valued variable( 离散 数值 变量 ) ，7 
Distributivity theorem( 分 配 律 ) 63 
div, 314 
Divide- by-3 counter( 除 以 3 计数 器 ) 
design of (iit), 129-131 
HDL for( 人 硬件 描述 语言 )，210-211 
Divider( 除法 器 ) ，253-254 
Division( RYE) 
circuit( 电路 ) , 253-254 
MIPS instruction( MIPS ##4>) , 314 
MIPS signed and unsigned instruction ( MIPS 有 符 
号 与 无 符号 指令 ) 345 
divu, 345 
Don’ t care(X， 无 关 项 ) 69, 81-83, 205 
Dopant atom( JET), 27 
Double, C type( 浮 点 数 ，C 类 型 ) 630-631 
Double- Data Rate Memory (DDR， 双 数据 速率 内 
存 ) 266, 561 = 
Double- precision format ( 双 精 度 格 式 ) , 257-258 
Do/while loop, in C ( do/while 循环 , Æ C 语言 
中 ) 641-642 
DRAM( 动 态 随 机 存储 器 ) ， 另 见 Dynamic random 
access memory 
Dual Inline Memory Module( DIMM, X49!) Bim A EF 
模块 ) ，561 
Dual- Inline Package( DIP， 双 列 直 插 式 封装 )，28， 
583, 599 
Dynamic branch predictor( 动态 分 支 预测 ) 446 
Dynamic data segment( 动态 数据 段 ) 337 
Dynamic discipline( 动态 约束 )， 另 见 Timing analy- 
sis, 142-151 
Dynamic memory allocation(malloc, free, 动 态 内 
存 分 配 )，654-655 
in MIPS memory map( 在 MIPS 内 存 映 射 中 ) ，337 
Dynamic power( 动态 功 耗 ) ，34 
Dynamic Random Access Memory( DRAM, 动态 随机 
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存储 器 ) 266, 267, 475-478, 561 


E 


Economics( 经 济 ) ，615 
Edge-triggered flip- flop ( H 745 fith Az AEAF), A I 
flip-flop 
EEPROM( 电 可 探 除 可 编程 只 读 存 储 器 ) ， 另 见 E- 
lectrically erasable programmable read only memory 
EFLAGS register( EFLAGS 寄存 器 ) , 350 
Electrically erasable programmable read only memory 
(EEPROM, Al PRR Al Sate Rise tetas) , 269 
Embedded I/O( input/output) system( #% Ast IO ( $j 
和信/ 输出 ) 系 统 ) , 508-558 
analog IO( 模 拟 I/O) , 531-537 
A/D conversion( 模 / 数 转换 ) , 532-533 
D/A conversion ( 数 / 模 转换 ) , 533-536 
digital 1/O( 数字 1/0) , 513-515 
general-purpose I/O(GPIO, ÑH 1/0) , 513-515 
interrupt( 中 断 ) , 529-531 
LCD ( 液晶 显示 屏 ) , % JL Liquid Crystal Display 
microcontroller peripheral (单片机 外 部 设备 )， 
537-558 
motor( 电机 ) ， 另 见 Motor 
PIC32 microcontroller( PIC32 单片机 ) , 509-513 
serial IIO( 串 行 IO) ， 另 见 Serial I/O, 515-527 
timer( 计时 器 ) , 527-529 
VGA monitor( VGA 显示 需 ) ， 另 见 VGA monitor, 493 
Enabled flip-flop( 使 能 触发 器 ) , 115-116 
Enabled register ( 使 能 寄存 器 )， 另 见 flip- flops, 
196-197 
EPC ( 异常 程序 计数 器 )， 另 见 Exception program counter 
EPROM ( 可 擦 除 可 编程 只 读 存储 器 )， 另 见 Erasa- 
ble programmable read only memory 
Equality comparator( 相等 比较 器 ) ，247 
Equation minimization( 等 式 最 简化 ) 
using Boolean algebra( 使 用 布尔 代数 )，65-66 
using Kamaugh map( 使 用 卡 诺 图 ) ， 另 见 Karnaug 
map 
Erasable Programmable Read Only Memory ( EPROM, 
可 擦 除 可 编程 只 读 存储 器 ) , 269, 588 
Ethernet( 以 太 网 ) , 561 
Exception Program Counter ( EPC， 异 常 程序 计数 
fx), 343-344 
Exception( 异常 ) , 343-344, 440-443 


Cause, 4 JL Cause register cause code, 344 


EPC, ¥% JL Exception program counter handler, 343 
processor support for( 处 理 需 支持 ) , 440-443 
circuit( 电路 ) ，441-442 
controller( 控制 器 ) ，442-443 
Executable file( 可 执行 文件 ) 340 
Execution time( 执行 时 间 ) ，375 
exit, 663 
Extended Instruction Pointer ( EIP, # E 45 4 45 
EF), 348 


F 


Factorial function call ( I eK AAA) , 330-331 
stack during( $k) , 331 
Factoring state machine( 分 解 状态 机 ) , 134-136 
FDIV( 浮 点 数 除 法 ) , 3% JL Floating- point division 
Field Programmable Gate Array(FPCA ， 现 场 可 编程 
逻辑 门 阵 列 ) 274-279, 457, 520, 543, 564, 
589-591 
driving VGA cable( 驱动 VGA 2%) , 543 
in SPI interface( 在 SPI 接口 ) 519-521 
File manipulation, in C (C 语言 中 文件 操作 )， 
660-662 
Finite state machines (FSM, @ PRIRA BL), 123- 
141, 209-213 
deriving from circuit( 源 于 电路 ) 137-140 
divide- by- 3 FSM ( BR LA 3FSM), 129- 131, 
210-211 
factoring ( 因子 分 解 ) 134-136, 136 
in HDL( 在 HDL #), 209-213 
LE configuration for( LE 配置 ) ，277-278 
Mealy FSM( Mealy FSM) , 132-134 
Moore FSM( Moore FSM), 132-134 
multicycle control (多 周期 控制 )，396- 408, 
405 , 408 
snail/pattern recognizer FSM ( 蜗牛 /模式 识别 
FSM), 132-134, 212-213 
state encoding ( 状态 编码 )， 另 见 Binary enco- 
ding, One- cold encoding, One- hot encoding, 
129-131 
state transition diagram( 状态 转换 图 ) , 124, 125 
traffic light FSM( 交通 灯 FSM), 123-129 
Fixed- point number( 定点 数 ) , 255-256 
Flag( 标 志 ) , 250 
Flash memory( 闪存 ) ， 另 见 Solid state drive, 269 
Flip- flop (触发 器 )， 另 见 Register, 114- 118, 
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193-197 
back-to- back( #74E 7 ) , 3% JL Synchronizer, 145, 
152-157, 197 
comparison with latches( 与 锁 存 器 比较 ) 118 
enabled( 使 能 ) 115-116 
HDL for( 硬件 描述 语言 ) ， 另 见 Register，436 
metastable state of( 亚 稳 态 ) ， 另 见 Metastability reg- 
ister, 114-115 
resettable( Fh] HH), 116 
scannable( 可 扫 摘 ) , 262-263 
shift register( 移 位 寄存 器 ) 261-263 
transistor count( 晶体 管 计 数 ) 114, 117 
transistor- level ( 品 体 管 级 ) 116-117 
Float, C type( C 语言 浮 点 数 ) 628-631 
print format of ( 输出 格式 ) ，658-659 
Floating output node( 浮 点 输出 节点 ) 117 
Floating point division (FDIV ) bug( 浮 点 数 除 法 错 
te), 175 
Floating(Z, 725), 74-75 
in HDL( 在 HDL 中 ) , 186-188 
Floating- gate transistor ( 浮 栅 晶体 管 )， 另 见 Flash 
memory ，209 
Floating- point coprocessor( 浮 点 数 协 处 理 器 ) ，457 
Floating-point division( FDIV， 浮 点 数 除 法 ) 259 
Floating- point instruction, MIPS ( MIPS 浮 点 数 指 
4), 346-347 
Floating-point number( 浮 点 数 ) 256-257 
addition( 加 法 ) , 258-259 
formats ，single- and double- precision( 格式 ， 单 精 
度 与 双 精 度 ) ，256-258 
in programming (在 编程 时 )， 另 见 Float 
and Double 
rounding( JUHA), 258 
special case( 特殊 情况 ) 
infinity( 无 穷 大 ) , 257 
NaN, 257 
Floating- point unit( FPU， 浮 点 数 单元 ) 259, 461 
For loop( for 循环 ) , 319-320, 322, 642 
Format conversion ( atoi ，atol，atof， 格 式 转 
换 ) ，663-664 
Forwarding( 重 定 回 ) ， 另 见 Hazard, 416-418 
FPGA ( 现场 可 编程 逻辑 门 阵列 ) ， 另 见 Field pro- 
grammable gate array 
FPU( 浮 点 数 单元 ) ， 另 见 Floating-point unit 
Frequency Shift Keying( FSK， 频 移 键 控 ) 548 
and GFSK waveform( GFSK 波形 ) ，548 
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Front porch( RJAR) , 542 
FSK( 频 移 键 控 ) , 4% WL Frequency Shift Keying 
FSMs( @ BRIRASAL) , 3% JL Finite State Machine 
Full adder( 全 加 器 ) , 56, 182, 184, 200, 240 
using always/process statement ( 使 用 always/ 
process 语句) , 200 
Fully associative cache( 全 相 联 高 速 缓存 ) 487-488 
Funct field( Funct 字段 ) 305, 621-622 
Function call( AJH) , 325-333, 637-638 
argument( 参数 ) 325-326, 637 
leaf( 叶子 ) 330 
naming convention( 命名 惯例 ) , 638 
nonleaf( 非 叶 子 ) 330 
preserved and non- preserved register ( 受 保护 与 不 
受 保护 寄存 器 ) , 329-332 
prototype( 原型 ) 638 
recursive( 递归 ) , 330-332 
retum( 返回 ) , 325-326, 637 
stack, use of( 栈 ， 使 用 ) ， 另 见 Stack, 327-333 
with no inputs or output( 无 输入 或 输出 ) 325, 637 
Fuse- programmable ROM( 熔 丝 型 可 编程 ROM) 269 
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Gated time accumulation( 门 控 时 间 累 加 ) , 529 
Gate( 门 ) 

AND( 5), 20, 22, 128 

buffer( 缓冲 器 ) 20 

multiple- input( 多 输入 ) ，21-22 

NAND (与 非 ) 21, 31 

NOR( 或 非 ) 21-22, 111, 128 

NOT( 非 ) 20 

OR( 或 ) 21 

transistor-level( 晶体 管 级 ) ， 另 见 Transistor 

XNOR( 同 或 ) 21 

XOR( 异 或 ) 21 
General- purpose I/O( GPIO, 通用 10), 513 

PIC32 port( pin) of ( PIC32 端口 ( 管 脚 ) ) 515 

switch and LED example( 开关 与 LED 灯 示 例 )， 

513-514 

Generate signal( 生成 信号 ) 241, 243 
Genwaves function( Genwaves PAL) , 535 
Glitches ( 毛刺 )，92-95 
Global data segment ( 全 局 数据 段 ) 336-337 
Global pointer( $ gp ， 全 局 指针 ) , 337 
CPIO( 通 用 IO ) ， 另 见 General-purpose 1/0 
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Graphics accelerator( 图 形 加 速 器 ) , 464 

Graphics Processing Unit (GPU, B| JÉ Ab H Æ% 
Ju), 457 

Gray code( 格雷 码 ) 76 

Gray, Frank, 76 

Ground(GND, žb), 22 
symbol for( 符号 ) 31 
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Half adder( 半 加 器 ) , 240, 240 
Hard disk( 硬盘 ) ， 另 见 Hard drive, 478-479 
Hard drive ( 1 Æ), p JL Hard disk, Solid state 
drive, and Virtual memory, 478-479, 496 
Hardware Description Language ( HDL， 硬 件 描述 语 
A), ， 另 见 SystemVerilog, VHDL 
capacity( 容量 ) ，493 
combinational logic( 组 合 逻辑 ) , 174, 198 
bitwise operator( 位 操作 ) ，177-179 
blocking and nonblocking assignment( 阻塞 和 非 
阻塞 赋值 ) 205-209 
case statement( case 语句 ) ，201-202 
conditional assignment( 条 件 赋值 ) 181-182 
delay( HEMT) , 188-189 
data type( 数据 类 型 ) 213-217 
history of ( 历史 ) 174-175 
if statement( if 14%] ) , 202-205 
internal variable( 内 部 变量 ) 182-184 
number( 数字 ) 185 
operator and precedence ( 运算 符 和 优先 级 ) , 
184-185 
reduction operator ( 缩减 运算 符 ) , 180-181 
module ( 模块 ) 173-174 
parameterized module( 参数 化 模块 ) 217-220 
processor building block (处 理 器 构建 模块 )， 
434-437 
sequential logic( 时 序 逻 辑 ) ，193-198 209-213 
simulation and synthesis( 仿真 与 综合 ) , 175-177 
single- cycle MIPS processor ( 单 周 期 MIPS 处理 
fx), 429-440 
structural modeling ( 结构 建 模 ) , 190-193 
testbench ( 测试 程序 ) 220-224, 437-438 
Hardware handshaking ( 人 硬件 握手 ) , 523 
Hardware reduction ( 人 硬件 减少 ) , 4% JL Equation min- 
imization, 70-71 


Hazard unit( 冲突 单元 ) , 416-427 


Hazard( 冲突 ) ， 另 见 Hazard unit 
control hazard( 控制 冲突 ) ，415 ，421-424 
data hazard( 数据 冲突) 416-421 
Read After Write ( RAW， 写 人 后 读 取 )， 
415, 451 
solving ( 解决 ) 
control hazard ( 控制 相关 ) , 421-424 
forwarding ( Hi fe i] ) , 416-418 
stall( BASE) , 418-421 
Write After Read( WAR, BURSA), 451 
Write After Write (WAW, BSA JM BA), 
451-452 
H- bridge control ( H 桥 控制 ) , 550 
HDL( 硬 件 描述 语言 ) ， 另 见 Hardware description 
language, SystemVerilog 和 VHDL 
Heap( HE) , 337 
Heterogeneous multiprocessor ( Ft #4 2 Ah FE AF), 
456-458 
Hexadecimal number( 十 六 进 制 数 ) , 11-13 
Hexadecimal to binary and decimal conversion ( 十 六 
进 制 -二 进 制 与 十 进 制 转换 ) 11, 72 
Hierarchy( 层次 化 ) ，6 
HICH( 高 电 平 ) ， 另 见 1，ON，22 
High-level programming language (高 级 编程 语言 ) ， 
296, 624 
compiling, assembling, and loading ( 编译 、 汇 编 
SRA), 336-341 
translating into assembly ( 转换 成 汇编 语言 ) 300 
High- performance microprocessor ( 高 性 能 微 处 理 
fit) , 444 
Hit( 命中) 478 
Hit rate( 命中 率 ) 478-480 
Hold time constraint( 保持 时 间 约 束 ) 142-148 
with clock skew( 时 钟 偏 移 ) ，149-151 
Hold time violation ( 保持 时 间 约 束 违 反 )，145， 
146, 147-148, 150-151 
Homogeneous multiprocessor ( 同 构 多 处 理 器 ) , 456 
Hopper, Grace, 337 


IA-64, 354 

IA-32 architecture( IA-32 体系 结构 ) ， 另 见 x86 
ICs( 集成 电路 ) ， 另 见 Integrated circuit 
Idempotency theorem( HEM), 62 

Identity theorem( 同一 性 定理 ) 62 
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Idiom ( 惯用 语法 ) 177 
If statement ( if 语句) 
in C(C 语言 中 ) 639 
in HDL( HDL 中 )，202-205 
in MIPS assembly( MIPS 汇编 语言 中 ) 316-317 
If/else statement( if/else 语句 ) ，317 ，649 
in C(C 语言 中 ) 639-640 
in HDL( HDL 中 ) , 202-205 
in MIPS assembly( MIPS 汇编 语言 中 ) ，317 
IM( 指令 存储 器 ) ， 另 见 Instruction memory 
Immediate addressing( 直接 寻 址 ) 333 
Immediate( 立即 数 ) ， 另 见 Constant, 304, 313 
32-bit(32 7), 313 
immediate field( 立即 数字 段 ) 307-308 
logical operation with( 逻辑 操作 ) ，377 
Implicit leading one( 隐 含 前 导 位 ) 256 
Information, amount of( 信息 量 ) 8 
Initializing( 初始 化 ) 
arrays in C(C 语言 数组 ) 645-646 
variables in C(C 语言 变量 ) 633 
InitTimerl Interrupt function ( InitTimerl Interrupt PŘI 
a) , 530 
Input/output element( IOE) (输入 /输出 元 素 ) , 274 
Input/Output (1/0 ) system ( 输入/ 输出 系统 )， 
506-569 
device driver( 设备 驱动 程序 ) , 507-508, 526 
embedded I/O system ( i A xt ij A/ fii tH} RA), 
j JL Embedded I/O system 
I/O register( I/O 寄存 器 ) , 507-508 
memory-mapped 1/0( 内 存 映 射 1/0) , 507-508 
personal computer I/O system( 个 人 计算 机 I/O 系 
统 ) ， 另 见 Personal computer I/O system 
Institute of Electrical and Electronics Engineer( IEEE, 
电气 电子 工程 师 学 会 ) , 257 
Instruction encoding, x86 ( x86 指令 编码 )，352- 
354, 353 
Instruction format, MIPS( MIPS 指令 格式 ) 
F-type( F Æ!) , 346 
I-type(I #2) , 307-308 
J-type( J #2) , 308 
R-type(R #1), 305-306 
Instruction format( x86 指令 格式 ) x86, 352-354 
Instruction Level Parallelism ( ILP, 44 4 23-747) ), 
452, 455 | 
Instruction Memory( IM， 指 令 存 储 器 ) 373, 411 
MIPS( 每 秒 百 万 条 指令 ) ，440 
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Instruction Register(IR ， 指 令 存 储 器 ) , 391, 398 
Instruction set ( 指令 集 )， 另 见 Architecture, 295, 
371-372 
Instruction, MIPS( MIPS 指令 ) 295-347, 619-622 
arithmetic ( 算术 ) 299- 300, 304, 314, 344- 
345, 620-622 
branching( 分 支 ) 314-316 
floating- point( 浮 点 ) ，346-347 ，622 
for accessing memory (访问 内 存 )， 另 见 
Load, Store 
F-type( F #!) , 346 
I-type(I HY) , 307-308 
J-type(J Æ!) , 308 
logical (#748) , 308, 310-313 
multiplication and division (乘法 和 除法 )， 
314, 345 
R-type( R #¥) , 305-306, 621-622 
set less than( 小 于 设置 ) 319-320, 345 
signed and unsigned( 有 符号 和 无 符号 ) , 344-345 
Instruction, x86( x86 指令 ) 347-355 
Instructions Per Cycle(IPC， 每 周期 指令 数 ) 375 
Integer Execution Unit(IEU， 整 数 执行 单元 ) 461 
Integrated Circuit( IC ， 集 成 电路 ) 599 
Intel ， 另 见 x86 
Intel x86 ， 另 见 x86 
Interrupt Service Routine(ISR ， 中 断 服务 例 程 ) ， 另 
见 Exception, 529 
Interrupt( FET), 343, 529-531 
PIC32, 529-531 
Invalid logic level ( XOZ BÆ), 186 
Inverter( 反 相 髓 ) ， 另 见 NOT gate, 20, 119, 178 
cross- coupled( 交叉 耦合 ) 109, 110 
in HDL( 在 HDL 中 )，178，199 
Involution theorem( 回旋 定理 ) ，62 
WO( 输 入 /输出 系统 ) 另 见 Input/output systems 
IOE( 输入 /输出 元 素 ) 另 见 Input/output elements 
IorD 393, 397 
IPC ( 每 周期 指令 数 ) , 4% WL Instructions per cycle 
IR( 484454448) , P JL Instruction register 
IRWrite, 391, 397 
ISR( 中 断 服 务 例 程 ) 4% JL Interrupt service routine 
I-type instructions (I 型 指令 )，307-308 
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j, 315-316 
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jal, 325 

Java( Java 语言 ) J JL Language, 322 

jr, 315-316, 325 

JTA( 跳 转 目标 地 址 ) ， 另 见 Jump target address 

J-type instructions(J 本 型 指令 ) 308 

Jump, MIPS instruction( MIPS 指令 跳 转 ) , 315-316 

Jump, processor implementation ( 跳 转 ， 处 理 器 实 
IL), 386-387, 404-408 

Jump Target Address (JITA， 跳 转 目 标 地 址 ) 334- 
335, 386 


K 


Karnaugh map ( K- map, F if A), 75- 84, 93- 
95, 126 
logic minimization using( 用 于 人 逻辑 最 人 简化) 77-83 
prime implicant( 主 蕴 含 项 )，65,77-81，94-95 
seven- segment display decoder( 七 段 显示 译 码 器 ) ， 
79-81 
with “don’t cares”( 包含 无 关 项 ) 81-82 
without glitch( 无 毛刺 ) ，95 
Karnaugh, Maurice, 75 
K-map( 卡 诺 图 ) ,, 4 JIL Karnaugh map 
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LAB( 逻 辑 阵 列 块 ) ， 另 见 Logic array block 
Land grid array( 栅 格 阵列 ) ，558 
Language( 编程 语言 ) ， 另 见 Instruction 
assembly( 汇 编 ) 296-304 
machine( #L#§) , 305-310 
mnemonic( 助 记 符 ) 297 
translating assembly to machine ( 转换 汇编 语言 为 
机 器 语言 ) ，306 
Last- in- first- out ( LIFO ) queue( 后进 先 出 (LIFO ) BA 
列 )， 另 见 Stack, 327 
Latches( 锁 存 器 ) 111-113 
comparison with flip- flop (与 触发 器 比较)， 
109, 118 
D, 113, 120 
SR, 111-113, 712 
transistor- level ( 晶体 管 级 ) 116-117 
Lateney( 延 时 ) , 157-160, 409-411, 418 
Lattice, silicon( 唱 格 ， 硅 ) 27 
lb, load byte( 1b ， 装 人 字 节 ) ， 另 见 Load 
lbu, load byte unsigned(1b， 装 人 无 符号 字 节 ) ， 
另 见 Load 
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LCD ( REIRAS), J J Liquid crystal display 
Leaf function( 叶子 函数 )，330 
Leakage current( 漆 汤 电流 )，34 
Least recently used ( LRU ) replacement ( 最 近 最 少 使 
用 (LRU ) 蔡 换 ) 490-491 
two-way associative cache with ( 两 路 相 联 高 速 组 
存 ) 490-491, 491 
Least significant bit(lsb ， 最 低 有 效 位 ) 13, 14 
Least Significant Byte ( LSB, RRA MSW), 13, 
14, 302 
LEEJA), ， 另 见 Logic element 
Level- sensitive latch ( 电 平 敏感 锁 存 船 )， 另 见 
D latch 
lh, load half( 1h, #A*FF 1), 7JL Load 
lhu, load half unsigned ( lhu， 装 入 无 符号 半 子 
节 ) ， 另 见 Load 
LIFO( 后进 先 出 队列 ) ， 另 见 Last-in-first- out queue 
Line options, compiler and command ( 编译 器 和 命令 
行 选 项 ) , 665-667 
Linked list( 链表 ) , 655-656 
Linker( 链接 器 ) ，340-341 
Liquid Crystal Display ( LCD, 液 唱 显示 屏 )， 
538-541 
Literal( 项) , 58, 96 
Little- endian memory ( 小 端 存储 ) , 302-303, 302 
Little- endian bus order in HDL (小 端 总 线 顺 
Fr), 178 
Load( 48A.), 345 
base addressing of ( 基 址 寻 址 ) , 333 
load byte( 1b or lbu, 2 A*B 4), 304, 323- 
324, 345 
load half( 1h or lhu, AFT), 345 
load word( 1w, AF), 301-304 
Local variable( 局 部 变量 ) 332-333 
Locality( 局 部 性 ) , 476 
Logic ( 逻辑 ) 
bubble pushing( 推 气泡 ) , 71-73 
combinational ( 组 合 逻 辑 ) ， 另 见 Combinational logic 
family( 系列 ) , 597-599 
gate( 门 ) ， 另 见 Gate 
hardware reduction ( 硬件 减少 )， 另 见 Equation 
simplification and Hardware reduction 
multilevel (2%) ， 另 见 Multilevel combinational logic 
programmable( 可 编程 的 ) 584-591 
sequential ( 时 序 逻 辑 ) ， 另 见 Sequential logic 
transjstor-level( 晶体 管 级 ) ， 另 见 Transistor 
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two-level( 二 级 ) 69 
Logic Array Block(LAB， 逻 辑 阵 列 块 ) , 275 
Logic array ( 7% 48 E Fi] ), 4 JL Programmable logic 
array and Field programmable gate array, 272-280 
transistor- level implementation ( 晶体 管 级 实现 )， 
279-280 
Logic element(LE, #44370), 274-279 
of Cyclone IV, 276 
function built using( 用 于 构建 函数 ) ，277-278 
Logic family (i244 AF!) , 25, 597-599 
compatibility of 兼容 性 ) 26 
logic level of( 逻辑 电 平 ) , 25 
specification( 规范 说 明 ) , 597, 599 
Logic gate( 逻辑 门 )，19-22,，779，584 
AND( 与 门 ) ， 另 见 AND gate 
AND-OR( AO) gate( 与 或 门 ) 46 
multiple- input gate( 多 输入 门 ) 21-22 
NAND( 与 非 门 ) ， 另 见 NAND gate 
NOR( 或 非 门 ) ， 另 见 NOR gate 
OR( 或 门 ) ， 另 见 OR gate 
OR- AND- INVERT (OAL) gate (或 与 非 ( OAI) 
门 ) 46 
with delay in HDL( 在 HDL FERIER), 189 
XNOR( 同 或 门 ) 4 2 XNOR gate 
XOR( 异 或 门 ) ， 另 见 XOR gate 
Logic level( 逻辑 电 平 ) 22-23 
Logic simulation( 逻辑 模拟 ) , 175-176 
Logic synthesis (i 4A), 176-177, 176 
Logical instruction ( 244454), 311-312 
Logical shifter( 逻辑 移 位 器 ) , 250 
Lookup table(LUT， 查 找 表 ) 270, 275 
Loop( 循 环 ) 317-319, 641-642 
in C( 在 C 语言 中 ) 
do/while, 641-642 
for, 642 
while, 641 
in MIPS assembly ( 在 MIPS 汇编 语言 中 ) 
for, 319-320 
while, 318-319 
LOW( 低 电 平 ) 另 见 0，OFF，22 
Low Voltage CMOS Logic( LVCMOS, I E He CMOS 
逻辑 ) , 25 
Low Voltage TTL Logic( LVTTL, (REE TTL 逻辑 ) , 
25 
LRU ( 最 近 最 少 使 用 替换 )， 另 见 Least recently 


used replacement 
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LSB( 最 低 有 效 字 节 ) ， 另 见 Least significant byte 

lsb( 最 低 有 效 位 ) ， 另 见 Least significant bit 

LUT( 查找 表 ) ， 另 见 Lookup table 

LVCMOS( 低 电压 CMOS 逻辑 ) ， 另 见 Low Voltage 
CMOS Logic 

LVTIL( 低 电压 TTL 逻辑 )， 另 见 Low Voltage 
TTL Logic 

lw, load word(lw, AF), 4% JL Load 
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Machine code, assembly and (机 器 代码 ， 汇 编 语 
BH), 437 
Machine language( 机 器 语言 ) 305-310 
format( 格式 ) ，305-308 
F-type( 了 上 型 ) 346 
I-type( 工 型 ) 307-308, 307 
J-type( J Z!) , 308, 308 
R-type(R Æ), 305-306, 305 
interpreting ( 解释 ) , 308-309 
stored program( 存储 程序 ) , 309-310, 3/0 
translating assembly language to (转换 汇编 语言 
ŽI), 306 
Magnitude comparator( 数量 比较 器 ) , 247 
Main decoder( 主 译 码 器 ) , 382-387 
HDL for( 硬件 描述 语言 )，432 
main function in C(C 语言 中 的 main 图 数 ) 625 
Main memory( 主 存 ) ，478 
Malloc function( Malloc Æ) , 654 
Mantissa( 尾数 ) 258-259 
Mapping( 映射 ) 482 
Master latch( 主 锁 存 器 ) 114 


_ Master-slave flip-flop( € - 从 触发 器 ) 114 


Masuoka, Fujio, 269 

math. h, C library( C 1% PRUE) ，664-665 

Max- delay constraint ( 最 大 延 时 约束 ) ， 另 见 Setup 
time constraint 

Maxterm( 最 大 项 ) 58 

MCM( 多 心 片 模块 Mealy 机 ) ， 另 见 Multichip mod- 
ule Mealy machine, 123, 123, 132 
state transition and output table ( 状态 转换 和 输出 

KR), 134 

state transition diagrams ( 状态 转换 图 ) , 133 
timing diagram for( 时 序 图 ) 135 

Mean Time Between Failure( MTBF ， 平 均 故 障 间 隔 
时 间 ) ，153-154 
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Medium- Scale Integration( MSI) chip ( 中 等 规模 集成 
(MSI) 芯片 ) 584 
Memory( 存 储 器 ， 内 存 ) ， 另 见 Memory array 
addressing mode( 寻 址 模式 ) , 349 
area and delay( jij FAMIZEIS ) ，266-267 
arrays ( 阵列 ) , 3 IL Memory arrays average memo- 
ry access time, 479 
big-endian( Köm), 178, 302-303 
byte- addressable ( 字 节 可 寻 址 ) , 301-303 
HDL for( 硬件 描述 语言 )，270-272 
hierarchy( 层次 ) ，478 
little-endian( 小 端 ) ，178 ，302-303 
logic using( 逻辑 ) , 270-272 
main( 主 ) ，478 
operand in( 操作 数 ) ，301-304 
physical ( 物理 ) ，497 
port( 端口 ) 265 
protection ( 保护 ) ， 另 见 Virtual memory, 503 
type( 类 型 ) 265-270 
DDR( 双 倍数 据 速率 ) ，267 
DRAM( 只 读 存 储 器 ) 266 
flash( 闪存 ) ，269-270 
register file( 寄存 需 文 件 ) 267-268 
ROM, 268-270 
SRAM, 266 
virtual ( 虚拟 的 ) ， 另 见 Virtual memory, 478 
Memory array (存储 器 阵列 )， 另 JIL Memory, 
263-272 
bit cell( 位 元 ) , 264-269 
HDL for( 硬件 描述 语言 ) , 270-272 
logic using( 逻辑 ) , 270-272 
organization( 组 成 ) ，263-265 
Memory hierarchy( 存储 器 层次 ) ，478-479 
Memory interface( 存储 器 接口 ) 475-476 
Memory map( 内 存 映 射 ) 
MIPS, 336-337, 341, 507 
PIC32, 509-510 
Memory Performance (存储 器 性 能 ) ， 另 见 Average 
Memory Access Time 
Memory protection( 存储 器 保护 ) 503 
Memory system( 存储 器 系统 ) ，475 
MIPS, 495 
performance analysis( 性 能 分 析 ) , 479-480 
x86, 564-568 
Memory-mapped IO( 内 存 上 映射 1/0) 
address decoder( 地 址 译 码 器 ) ，507 
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communicating with I/O device (与 I/O 设备 通 
{8 ) , 507-508 
hardware ( 硬件 ) , 508 
Mem Write, 379, 397 
MemtoReg, 380, 397 
Metal- oxide- semiconductor field effect transistor 
(MOSFET,， 人 金属 氧化 物 半 导体 场 效 应 唱 体 
管 ), 26 
switch model of( 开关 模型 )，30 
Metastability( 亚 稳 态 ) 151-157 
metastable state( 亚 稳 态 )，110,，151 
resolution time( 解析 时 间 )，151-152，154-157 
synchronizer( 同步 器 ) , 152-154 
mfc0 ， 另 见 Move from coprocessor 0 
Microarchitecture( 微 体 系 结 构 ) ， 另 见 Architecture, 
351-466 
advanced ( 先进 微 体 系 结 构 )， 另 见 Advanced mi- 
croarchitecture 
architectural state( 体系 结构 状态 ) ， 另 见 Archi- 
tectural state 
description of ( 描述 ) ，371-374 
design process( 设计 流程 ) ，372-374 
HDL representation( HDL 表示 ) ，429-440 
multicycle processor( 4 Jal HALE ZS), 4 I Mul- 
ticycle MIPS processor 
performance analysis ( 性 能 分 析 ) ， 另 见 Perform- 
ance analysis, 374-376 
pipelined processor ( 流水 线 处 理 器 ) , % JL Pipe- 
lined MIPS processor 
single-cycle processor( 单 周 期 人 处理 器 ) , 7 JL Sin- 
gle-cycle MIPS processor 
x86, 458-465 
evolution of ( 演化 ) , 458 
Microchip ICD3 513 
Microchip In Circuit Debugger 3( ICD3), 513 
Microcontroller ( 微 控 制 器 ) , 508 
PIC32( PIC32MX675F512H) , 509-513, 510 
64- pin TQFP package in (64 管 脚 TQFP # 
装 ) 511 
operational schematic of( 运行 原理 图 ) ，572 
to PC serial link( 到 PC 串 行 链 路 ) 526 
pinout of( 引 脚 ) 511 
virtual memory map of ( 虚拟 内 存 映射 ) ，570 
Microcontroller peripheral ( 微 控 制 器 外 部 设备 )， 
537-558 
Bluetooth wireless communication ( 蓝牙 无 线 通 
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{8 ), 547-548 
character LCD( 字符 LCD), 538-541 
control ( 控制 ) , 540-541 
parallel interface( 并 行 接口 ) , 539 
motor control ( 电机 控制 ) , 548-549 
VGA monitor( VGA 显示 器 ) , 541-547 
Microcontroller unit(MCU ， 微 控制 器 单元 ) 508 
Micro-op( 微 操 作 ) ，461 
Microprocessor( 微 处 理 器 ) , 3, 13, 295 
architectural state of ( 体系 结构 状态 ) 310 
designer( 设计 者 ) 444 
high- performance( 高 性 能 ) ，444 
Millions of instructions per second (每 秒 百 万 条 指 
令 )，409 
Min- delay constraint ( 最 小 延 时 约束 )， 另 见 Hold 
time constraint 
Minterm( 最 小 项 )，58 
MIPS (每 秒 百 万 条 指令 )， 另 见 Architecture 
and Microarchitecture 
architecture( 体系 结构 ) , 296, 509 
floating- point instructions ( Y$ WIS ) , 346, 
346-347 
instruction set( 指令 集 ) , 385 
microarchitecture( 微 结构 ) 
multicycle (多 周期 )， 另 见 Multicycle 
MIPS processor 
pipelined ( 流水 线 ) , 3% JL Pipelined MIPS pro- 
cessor 
single- cycle ( Jal] #4), 35 见 Single- cycle 
MIPS processor 
microprocessor ( ARIEF), 441, 452, 455 
data memory ( 数据 存储 器 ) , 373 
instruction memory( 指令 存储 需 ) , 373 
program counter( 程序 存储 器 ) ，373 
register file( 寄存 器 文件 ) ，373 
state element of( 状态 元 素 ) 373 
processor control( 处 理 咒 控制) ，344 
register set( 寄存 器 集 ) , 300 
vs. x86 architecture( 与 x86 体系 结构 比较 ) 348 
MIPS instruction( MIPS 指令 )，295-356，2719-222 
branching( 分 支 ) ， 另 见 Branching 
formats ( 格式 ) 
F-type(F Œ), 622 
I-type(1 4) , 307, 307-308 
J-type(J #4) , 308, 308 
R-type( R 型 ) , 305-307 
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multiplication and division (乘法 和 除法 )， 
314，345 
opcode( 操作 码 ) , 620-62] 
R-type funct field(R 型 funct 字段 ) 621-622 
MIPS processor ( MIPS 处 理 器 ) ， 另 见 MIPS multi- 
cycle processor, MIPS pipelined processor, and 
MIPS single-cycle processor 
HDL for( 硬件 描述 语言 ) A IL MIPS single- cy- 
cle HDL 
MIPS register( MIPS 寄存 器 ) 
co- processor 0 register ( Hp Xb HH #E 0 寄存 器 )， 
344, 441-443 
program counter( 程序 计数 器 ) , 310, 372-373 
register file( 寄存 器 文件 ) 372-373 
register set( 寄存 器 集 ) ，298-300 
MIPS single- cycle HDL ( MIPS 单 周 期 HDL), 
429-440 
building block( 构 建 模 块 ) ，434-437 
controller( 控制 器 ) ，429 
datapath( 数据 通路 ) ，429 
testbench( 测试 程序 ) , 437-440 
Miss( 缺失 ) ，478-480 ，493 
capacity( 容量 ) , 493 
compulsory( 强制 ) ，493 
conflict( 冲突 ) , 486, 493 
Miss penalty( 缺失 惩罚 ) ，488 
Miss rate( 缺失 率 ) 478-480 
and access times( 访问 次 数 ) , 480 
Misses( 缺失 ) 
cache( 缓存 ) 478 
capacity( 容量 ) ，493 
compulsory ( 强制 ) ，493 
conflict( PR) , 493 
page fault( 页 面 失效 ) 497 
Modularity ( 模块 化 ) 6 
Modules, in HDL behavioral and structural ( 模块 ， 
在 HDL 行为 模型 和 结构 模型 ) 173-174 
parameterized module( 人 参数 化 模块 ) 217-220 
Moore, Gordon, 30 
Moore machine( Moore #1), 123, 132 
state transition and output table( 状态 转换 和 输出 
表 ) ，734 
state transition diagram( 状态 转换 图 ) ，733 
timing diagram for( 时 序 图 ) 135 
Moore’ s law( 摩尔 定律 ) 30 
MOS transistors (MOS 晶体管 ) ， 另 见 Metal- oxide 
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semiconductor field effect transistors 
MOSFET ( 4 J A 1k WE RS A), A 
JL Metal-oxide semiconductor field effect transistor 
Most significant bit(msb， 最 高 有 效 位 ) 13, 14 
Most Significant Byte(MSB， 最 高 有 效 字 节 )，13， 
14, 302 
Motor( 电动 机 ) 
DC( 直流 ),'548-552 
H-bridge( H 桥 )，550 
servo( 伺服 ) , 549, 552-554 
stepper( 步 进 ) , 548, 554-558 
Move from coprocessor 0(mfcO), 4 JL Exception 
mfcO, 344, 441-443 
MPSSE( 多 协议 同步 串 行 引擎 ) A JL Multi- Proto- 
col Synchronous Serial Engine 
MSB( 最 高 有 效 字 节 ) ， 另 见 Most significant byte 
msb( 最 高 有 效 位 ) ， 另 见 Most significant bit 
MSI chip( 中 等 规模 集成 ) ， 另 见 Medium-scale inte- 
gration 
MTBF( 平 均 故障 间隔 时 间 ) , 2% JL Mean time be- 
tween failure 
mul( multiply, 32-bit result, Æ, 32 位 结果 ) 314 
mult(multiply, 64-bit result, Fe, 64 位 结果 ) ，314 
Multichip module( MCM ， 多 芯片 模块 ) ，566 
Multicycle MIPS processor( 多 周期 MIPS Ab HEAS), 
389-408 
control ( 控制 ) , 396-404 
datapath ( 数据 通路 ) , 390-396 
performance( 性 能 ) , 405-408 
Multilevel combinational logic ( RA A iv), A 
R Logic, 69-73 
Multilevel page table( ZRAK), 504-506 
Multiple- output circuit( 多 输出 电路 ) ，68-69 
Multiplexer( JHF), 83-86 
definition of( Æ SZ), 83-84 
HDL for( 硬件 描述 语言 
behavioral model of( 行 为 模型 )，181-183 
parameterized N-bit( 参数 化 和 N 位 )，218-219 
structural model of( 结构 模型 ) ，190-193 
logic using( 逻辑 ) , 84-86 
symbol and truth table( 符号 和 真 值 表 ) ，83 
Multiplicand( 被 乘 数 ) ，252 
Multiplication( 乘 法) ， 另 见 Multiplier, 314, 345 
MIPS instruction( MIPS 指令 ) ，314 
signed and unsigned instructions( 有 符号 和 无 符号 
ta), 345 


Multiplier( 乘法 器 ) , 252-253 
schematic( 电路 图 ) , 252 
HDL for( 硬件 描述 语言 )，253 
Multiprocessor( HARFE ) 
chip(itsr) , 456 
heterogeneous( $44) , 456-458 
homogeneous( 同 构 ) , 456 
Multi- Protocol Synchronous Serial Engine ( MPSSE, 
多 协议 同步 串 行 引擎 ) 563, 563 
Multithreaded processor( 多 线程 处 理 需 ) ，455 
Multithreading( 多 线程 ) 455 
multu, 345 
Mux( 2 FA #8) , 3% JL Multiplexer 
myDAQ, 563 
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NAND(7400， 与 非 门 ) 585 
NAND gate( 与 非 门 ), 21, 21, 31 
CMOS, 31-32, 31-32 
Nested if/else statement( #4 if/else 语句 ) , 640 
Nibble( 242247) , 13-14 
nMOS transistors( nMOS 晶体 管 ) 28-31, 29-30 
Noise margin( 噪声 容 限 ) , 23-26, 23 
calculating( 计算 ) , 23-24 
Nonarchitectural state ( 非 体 系 结构 状态 ) , 372 
Nonblocking and blocking assignments( 非 阻 塞 与 阻塞 
赋值 ) 199-200, 205-209 
Nonleaf function( JEM} FT AŽ) , 330 
Nonpreserved register( 不 受 保 护 寄存 器 ) 329, 330 
nop, 342 
nor, 311 
NOR gate( 或 非 门 ) 21-22, 111, 128, 585 
chip( 7402, ihr), 585 
CMOS, 32 
pseudo- nMOS logic( {4 nMOS 逻辑 ) , 33 
truth table( 真 值 表 ) , 22 
Not a number( NaN) , 257 
NOT gate( 非 门 ) 20 
chip(7404, iH), 585 
CMOS, 31 
Noyce, Robert, 26 
Null element theorem( 零 元 定理 ) , 62 
Number conversion ( 数字 转换 ) 
binary to decimal ( 二 进 制 -十进制 ) , 10-11 
binary to hexadecimal ( 二 进 制 - 十 六 进 制 ) 12 


x §l 


decimal to binary ( 十 进 制 - Z4), 11, 13 
decimal to hexadecimal ( 十 进 制 - 十 六 进 制 ) 13 
hexadecimal to binary and decimal ( 十 六 进 制 -~ 二 
进 制 和 十 进 制 ) 11, 12 
taking the two’ s complement( 取 补 码 ) 16 
Number system( 数 制 ) 9-19 
binary( 二 进 制 ) 9-11, 70-11 
comparison of( 比较 ) 18-19, 79 
decimal( 十 进 制 ) ，9 
estimating powers of two( 估算 2 AYRE), 14 
fixed-point ( 定点 数 ) , 255, 255-256 
floating- point ( 浮 点 数 ) , 256-259 
addition( 加 法 ) , 258-259, 259 
special case( 特殊 情况 ) 257 
hexadecimal ( 十 六 进 制 ) 11-13, 12 
negative and positive( 负数 和 正 数 ) 15 
signed( 有 符号 数 ) 15 
unsigned( 无 符号 数 ) ，9-11 
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OFF(*%), 43.0, LOW, 23 
Offset ( W), 391, 392 
ON( FF) 4 21, HIGH, 23 
One- bit dynamic branch predictor(1 位 动态 分 支 预 
Wj), 446-447 
One-cold encoding( 独 冷 编码 ) , 130 
One-hot encoding ( 独 热 编码 ) 129-131 
One- Time Programmable ( OTP, 一 次 性 可 编 
程 ) 584 
Opcode( 操作 码 ) 305, 620-621 
Operand( 操作 数 ) 
MIPS( 每 条 百 万 条 指令 ) ，298-304 
immediate ( constant， 立 即 数 (常数 ))， 
304, 313 
memory ( 存储 器 ) , 301-304 
register( 寄存 器 ) , 298-300 
x86, 348-350, 349 
Operation code( 操作 代码 ) , 4 IL Opcode 
Operator( 运算 符 ) 
in C( Æ C 语言 中 ) 633-636 
in HDL( 在 HDL F), 177-185 
bitwise( 位 操作 ) ，177-181 
precedence( 优先 级 ) 185 
reduction( 缩减 )，180-181 
table of( 表 ) ，185 
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ternary( 三 元 ) 181-182 
or, 311 
OR- AND- INVERT ( OAI ) gate ( 5% 455 4E ( OAI) 
门 ) 46 
OR gate( 或 门 ) 21 
ori, 311-312 
OTP( 一 次 性 可 编程 )， 另 见 One-time programmable 
Out- of- order execution( 乱 序 执行 ) ，453 
Out-of- order processor( 乱 序 处 理 器 ) , 450-452 
Overflow( 溢出 ) 
handling exception for (处 理 异 常 )，343- 345, 
440-443 
with addition( 加 法 ) ，15 
Oxide( 氧化 物 ) ，28 
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Package, chip( #348, w} ), 599-600 

Packed arithmetic ( 封装 算术 ) , 454 

Page fault( 页 面 失效 ) , 497 

Page number( 页 码 ) 498 

Page offset( H mE), 498 

Page tabłe( 页 表 ) 498, 500-501 
number( 号 码 ) 504 
offset( 偏 移 量 ) ，$04 

Page( 页 ) ，497 

Paging( 分 页 ) ，504 

Parallel 1/O( 347 I/O) , 515 

Parallelism( 47) , 157-160 

Parity gate( 奇偶 校 验 门 ) 4 IL XOR 

Partial products( 部 分 积 ) , 252 

Pass by reference( 按 引用 传递 ) , 644 

Pass by value( 按 值 传 递 ) 644 

Pass gate( 传输 门 ) 3 JL Transmission gates 

PC( 4 Att BBL), A I Program counter ,or 
Personal computer 

PCB( 印刷 电路 板 ) ， 另 见 Printed circuit board 

PCE( 外 部 组 件 互 连 )， 另 见 Peripheral Component 
Interconnect 

PCI express( PCle) , 560 

PC- relative addressing( PC #AXT Fh), 333-334 

PCSre, 395, 396-397, 397 

PCWrite, 393, 397 

Pentium processors( Pentium ZbF#45) , 460, 462 
Pentium 4, 375, 463, 463-464 
Pentium II, 461 
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Pentium III, 375, 461, 462 
Pentium M, 464 
Pentium Pro, 461 
Perfect induction, proving theorems using ( 完全 归纳 
法 ,证明 定理 使 用 ) 64-65 
Performance Analysis (性 能 分 析 )， 另 I Average 
Memory Access Time，374-376 
multi- cycle MIPS processor( 多 周期 MIPS 处 理 
器 ) 405-407 
pipelined MIPS processor( 流水 线 MIPS Ab FB ae), 
426-428 
processor comparison ( Ab IERE LEH) , 428 
single- cycle MIPS processor ( 单 周 期 MIPS 处 理 
fe), 388-389 
Periodic interrupt( 周期 性 中 断 ) 530-531 
Peripheral bus clock( PBCLK， 外 设 总 线 时 钟 )，512 
Peripheral Component Interconnect ( PCI， 外 部 组 件 
互 连 ) ，560 
Peripherals device( 外 围 设备 ) 另 见 Input/output sys- 
tems 
Personal computer( PC ， 个 人 计算 机 ) ， 另 见 x86 
Personal computer( PC) I/O system( 个 人 计算 机 IO 
系统 ) 558-564 
data acquisition system( 数据 采集 系统 ) , 562-563 
DDR3 memory(DDR3 内 存 ) 561 
networking( 联网 ) , 561-562 
PCI ( 外 部 组 件 互 连 ) , 560 
SATA, 562 
USB, 559-560, 563-564 
Phase Locked Loop(PLL， 锁 相 环 路 ) , 544 
Physical address extension( 物理 地 址 扩展 ) , 567 
Physical memory( 物理 内 存 ) ，497 
Physical Page Number( PPN ， 物 理 页 号 ) 499 
Physical page( 物理 页 ) 497 
PIC32 microcontroller ( PIC32MX675F512H, PIC32 
Wiz h g), p 2X Embedded I/O systems, 
509-513 
Pipelined MIPS processor (流水线 MIPS Ah #8 #8 ) , 
409-428 
abstract view of( 抽象 视图 ) 411 
control ( 控制 ) ，413-414 
datapath( 数据 通路 ) , 412-413 
description( 描述 ) ，409-412 
hazard( 冲突 ) ， 另 见 Hazard，414-426 
performance( 性 能 ) ，426-428 
throughput( 吞吐 量 ) 411 
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Pipelining ( it 7K 2), 4% JL Pipelined MIPS proces- 
sor, 158-160 
PLA( 可 编程 逻辑 阵列 )， 另 I Programmable 
logic array 
Plastic Leaded Chip Carriers(PLCC， 塑 封 引 线 芯 片 
载体 ) , 599 
Platter( 盘 片 ) 496 
PLCC( 塑 封 引 线 芯 片 载体 ) ， 另 见 Plastic leaded 
chip carriers 
PLD ( HJ 4q 2 22 Ht As AF), % JL Programmable 
logic devices 
PLL( 锁 相 环 路 ) ， 另 见 Phase locked loop 
pMOS transistor( pMOS 晶体 管 ) 28-31, 29 
Pointer( 指针 ) , 643-645, 647, 650, 652, 654 
POS( 或 与 式 ) 4 JL Product-of-sums form 
Positive edge- triggered flip- flop( 正 边沿 触发 触发 
as), 114 
Power consumption( 能 量 消 耗 ) , 34-35 
Power processor element ( PPE) ( Power 处 理 单 元 
(PPE) ) 457 
PPN( 物理 页 号 ) ， 另 见 Physical page number 
Prefix adder( 前 级 加 法 器 ) ，243-245 ，244 
Prefix tree( RIRA) ，245 
Preserved register( 受 保护 寄存 器 ) 329-330, 330 
Prime implicant( EH Am), 65, 77 
Printed Circuit Board ( PCB， 印刷 电路 板 ))， 
601-602 
printf, 657-659 
Priority ( 优先 级 ) 
circuit( 电 路) ，68-69 
encoder( 编码 器 ) 102-103, 105 
Procedure call( 过 程 调 用 ) ， 另 见 Function call 
Processor- memory gap( Xb HES - 存储 器 差距 ) 477 
Processor performance comparison( 处 理 器 性 能 比较 ) 
multicycle MIPS processor( 多 周期 MIPS 处 理 器 ) , 
407-408 
pipelined MIPS processor (流水 线 MIPS 处 理 
器 ) 428 
single- cycle processor ( 单 周 期 MIPS Ab HE ZÈ), 
388-389 
Product- Of- Sum( POS) form( 或 与 式 形 式 ) 60 
Program Counter ( PC， 程 序 计 数 器 )，310，333 ， 
373 ，379 
Programmable Logic Array(PLA， 可 编程 序 逻 辑 阵 
列 ) 67, 272-274, 588-589 
transistor-level implementation( 晶体 管 级 实现 ) 280 
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Programmable Logic Device (PLD， 可 编程 逻辑 器 
件 ) ，588 
Programmable Read Only Memory(PROM， 可 编程 只 
读 存 储 器 ) , 268, 270, 584-588 
Programming( 编程 ) 
array( 数组) ， 另 见 Array 
branching( 分 支 ) ， 另 见 Branching 
conditional statements( 条 件 语 句 ) , 316-317 
constant( 常数 ) ， 另 见 Constant, Immediates 
function call( 图 数 调 用 ) ， 另 见 Functions 
in C(C 语言 ) ， 另 见 C programming 
in MIPS( 在 MIPS 中 ) ，310-333 
instruction( 指令 ) , 619-622 
logical instruction( 逻辑 指令 ) 311-312 
loop( 循环 ) ， 另 见 Loop 
multiplication and division( 乘法 和 除法 ) 314 
shift instruction( 移 位 指令 ) 312-313, 312 
PROM ( 可 编程 只 读 存 储 器 ) ， 另 见 Programmable 
read only memory 
Propagate signal( 传播 信号 ) 241 
Propagation delay( 传播 延迟 ) ， 另 见 Critical path, 
88-92 
Pseudo- direct addressing( 伪 直 接 寻 址 ) 334-335 
Pseudo instructions( 伪 指 令 ) ，342-343 
Pseudo-nMOS logic( 伪 nMOS 逻辑) , 33-34, 33 
NOR gate( 或 非 门 ) 33 
ROMs and PLA( ROM 和 PLA), 279-280 
Pulse- Width Modulation ( PWM, fk % dal Hl), 
536-537 
analog output with( 模拟 输出 ) , 537 
duty cycle( 425 tE), 536 
signal( 信号 ) ，536 
PWM( 脉 宽 调制 ) ， 另 见 Pulse- Width Modulation 


Q 
Quiescent supply current ( 静态 电源 电流 ) 34 
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Race condition( 竞争 条 件 ) 119-120, 720 

rand, 662-663 

Random Access Memory( RAM， 随 机 存 取 存储 器 )， 
265-267, 271 

Read After Write( RAW ) hazard( 写 信 后 读 取 (RAW ) 
冲突 ) ， 另 见 Hazards, 415, 451 

Read Only Memory ( ROM， 只 读 存 储 器 )，265， 
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268-269, 268-270 
transistor- level implementation ( 晶体 管 级 实现 )， 
279-280 
ReadData，378 
Read/ write head( 读 / 写 头 ) 496 
Receiver gate( 接收 门 ) ，22 
Recursive function call( 递归 因数 调用 ) 330-332 
Reduced Instruction Set Computer( RISC， 精 简 指 令 
集 计 算 机 ) 298 
Reduction operator( 缩减 运算 符 ) ，180-181 
RegDst, 381, 384, 397 
Register file( RE， 寄 存 器 文件 ) 
HDL for( 硬件 描述 语言 ) 435 
in pipelined MIPS processor( write on falling edge ) 
(在 流水 线 MIPS Ab BRR A CR MS 
A)), 412 
MIPS Register Description ( MIPS A AF #5 tH i ) , 
299-30 
schematic ( 电路 图 ) , 267-268 
use in MIPS processor (在 MIPS Ah 3E 48 oh {gi 
FA), 373 
Register renaming ( #4748 811% ) , 452-454 
Register set ( 2 F #5 2H), p J Register file, 
299-300 
Register- only addressing ( 寄存 器 寻 址 ) , 333 
Register( 47 4¢ 45), 4% JL Flip-flop, MIPS registers, 
and x86 registers 
Regularity ( 规整 化 ) 6 
RegWrite, 378, 384, 397, 413, 4/4 
Replacement policy ( 替换 策略 ) , 504 
Reserved segment ( 保留 段 ) 337 
Resettable flip-flop ( MAk Z#E) , 116 
Resettable register( 复位 寄存 器 ) , 194-196 
Resolution time( 解 析 时 间 ) , 151-152 
derivation of( 来源 ) 154-157 
另 见 Metastability 
RF( 寄存 器 文件 ) ， 另 见 Register file 
Ring oscillator( 环形 振荡 器 ) , 119, 119 
Ripple- carry adder( 行 波 进位 加 法 器 ) , 240, 240- 
241, 243 
Rising edge( 上 升 沿 ) 88 
ROM( 只 读 存储 器 )， 另 见 Read only memory 
Rotations Per Minute( RPM， 每 分 钟 转 数 )，549 
Rotator( 旋转 器 )，250-252 
Rounding mode( 舍 人 模式 ) 258 
RPM ( 每 分 钟 转 数 ) ， 另 见 Rotations per minute 
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RS-232, 523-524 
R-type instruction( R 型 指令 ) , 305-306 
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Sampling( 采样 ) ，141 
Sampling rate( 采样 率 ) ，531 
Sampling time( 采样 时 间 ) ，532 
SATA ， 另 见 Serial ATA 
sb, store byte( 存储 字 节 ) ， 另 见 Stores 
Scalar processor( 标量 处 理 器 ) , 447 
Scan chain( 扫描 链 ) ，261-263 
scanf, 660 
Scannable flip-flop ( FJ #4 fifth ae) , 262-263 
Schematics, rules of drawing( 电路 图 ， 绘图 规则 )， 
31, 67 
SCK( 串 行 时 钟 ) ， 另 见 Serial Clock 
SDI( 串 行 数据 输入 ) ， 另 见 Serial Data In 
SDO( 串 行 数据 输出 ) ， 另 见 Serial Data Out 
SDRAM( 同步 动态 随机 存 取 存 储 器 ) ， 另 见 Syn- 
chronous dynamic random access memory 
Segment descriptor( 段 描 述 符 ) ，353 
Segmentation( 分 段 )，354 
Selected signal assignment statement ( 选择 信和 号 赋值 
语句 ) 182 
Semiconductor( 半导体 ) ，27 
industry, sale( 工业， 销售 ) 3 
Sequencing overhead ( 测序 开销 )，143- 144，149， 
160, 428 
Sequential building blocks( 时 序 逻 辑 构 建 模 块 )， 另 
见 Sequential logic 
Sequential logic( 时 序 逻 辑 ) , 109-161, 260-263 
counter( 计数 器 ) ，260 
finite state machine( 有 限 状 态 机 )， 另 见 Finite 
state machine 
flip-flop( 触发 器 ) ， 另 见 Register, 114-118 
latche( 锁 存 器 ) ，111-113 
D, 113 
SR, 111-113 
register( 寄存 器 ) 3 JL Register 
shift register( 移 位 寄存 器 ) 261-263 
timing of( 时 序 ) ， 另 见 Timing Analysis 
Serial ATA( SATA, 47 ATA), 562 
Serial Clock( SCK, #4yHY#P)), 516 
Serial communication, with PC( 串 行 通信 ， 与 PC), 
525-527 
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Serial Data Im(SDI， 串 行 数 据 输入 ) 516 
Serial Data Out(SDO ， 串 行 数 据 输出 ) , 516 
Serial 1/O( #47 1/0) 515-527 
SPI( 串 行 外 设 接口 ) ， 另 见 Serial peripheral inter- 
face 
UART( 通 用 异步 收发 器 ) ， 另 见 Universal Asyn- 
chronous Receiver Transmitter 
Serial Peripheral Interface (SPI, $ 47 Spi HE), 
515-521 
connection between PIC32 and FPGA( PIC32 与 
FPGA 连接 )，579 
port ( 端口 ) 
Serial Clock(SCK， 串 行 时 钟 ) 516 
Serial Data In(SDI， 串 行 数 据 输 入 ) 516 
Serial Data Out(SDO ， 串 行 数据 输出 ) 516 
register field in( 寄存 器 字段 ) 517 
slave circuitry and timing( 从 电路 与 时 序 ) 520 
waveform( 波形 )，516 
Servo motor( 伺服 电动 机 ) , 549, 552-554 
Set bit( 设置 位 ) ，483 
set if less than immediate(slti), 345 
set if less than immediate unsigned(sltiu) , 345 
set if less than( slt) 
circuit ( 电路 ) ，250 
in MIPS assembly( 在 MIPS 汇编 中 ) ，319-320 
set if less than unsigned( sltu) 345 
Setup time constraint ( @# y At fa] A HR), 142, 
145-147 
with clock skew( #1 At 4b (mi #%) , 148-150 
Seven-segment display decoder (7 Ft {it AN EAS #5) , 
79-82 
HDL for( 硬件 描述 语言 ) 201-202 
with don’ t care( 包含 无 关 项 ) ，82-83 
SFR( 特殊 功能 寄存 器 ) ， 另 见 Special function reg- 
ister 
sh, store half( sh， 存 储 半 字 ) ， 另 见 Store 
Shaft encoder( 轴 角 编码 器 ) , 552, 552 
Shift instruction( 移 位 指令 ) ，312-313 ，372 
Shift register( 移 位 寄存 器 ) ，261-263 
Shifter( 移 位 器 ) , 250-252 
Short path( 最 短路 径 ) 89-92 
Sign Bit( 符 号 位 ) , 16 
Sign extension( 符号 扩展 ) 18, 308 
HDL for( 硬件 描述 语言 ) 436 
Signed and unsigned instruction( 有 符号 和 无 符号 指 
4), 344-345 
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Signed binary number( 有 符号 二 进 制 数 )，15-19 

Signed multiplier( 有 符号 乘法 器 ) 217 

Sign/magnitude number ( 47 ff = AY JR #3), 15- 
16, 255 

Silicon dioxide( Si02， 二 氧化 硅 ) 28 

Silicon lattice( 硅 唱 格 ) , 27 

SIMD( 单 指令 多 数据 )， 另 见 Single instruction mul- 
tiple data 

Simple programmable logic device( SPLD， 简 单 可 编 
程 逻 辑 器 件 ) 274 

Simulation waveform( 模拟 波形 ) ，176 
with delay( 包含 延 时 ) , 189 

Single-cycle MIPS processor( 单 周 期 MIPS 处 理 器 ) , 
376-389 
control( 控制 ) ，382-385 
datapath( 数据 通路 ) ，376-382 
example operation( 操作 示例 ) , 384-385 
HDL of( 硬件 描述 语言 )，429-440 
performance( 性 能 ) ，389 

Single Instruction Multiple Data( SIMD， 单 指令 多 数 
据 ) 447, 454, 463 

Single- precision format ( 单 精 度 格 式 ) ， 另 见 Float- 
ing-point number, 257-258 

Skew( m84), 5 IL Clock skew 

Slash notation( 斜 线 记 法 ) 56 

Slave latch( 从 锁 存 器 ) ， 另 见 D flip-flop, 114 

sll, 312 

sliv, 313 

SLT( 小 于 设置 ) 5 J set if less than 

slt, set if less than, 319-320 

slti, 345 

sltiu, 345 

sltu, 345 

Small- Scale Integration ( SSI) chip (小 规模 集成 芯 
Hr), 584 

Solid State Drive (SSD, HAWEA), 5 W Flash 
memory and Hard drive, 478-479 

SOP( 与 或 式 ) ， 另 见 Sum-of- products form 

Spatial locality( 空间 局 部 性 ) , 476, 488-490 

Spatial parallelism( 空间 并 行 ) 157-158 

Special function registers ( SFR， 特 殊 功 能 寄存 
fir) , 509 

SPECINT 2000, 406 

SPI( 串 行 外 设 接 口 ) 3% WL Serial Peripheral Inter- 
face 


Spinstepper function( Spinstepper 图 数 ) , 557 
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SPIxCON, 516 
Squashing( $F HE) , 452 
SR latche( SR 锁 存 器 ) 111-113, 1/2 
SRAM ( 静态 随机 存 取 存 储 器 ) ， 另 见 Static random 
access memory; 
srand, 662-663 
spl Siz 
sriy,-313 
SSI chip( 小 规模 集成 芯片 ) A JL Small-scale inte- 
gration 
Stack( 栈 ) ， 另 见 Function calls, 327-333 
during recursive function call (在 递归 函数 调用 
mH), 33] 
preserved register ( 受 保护 寄存 器 ) , 329-330 
stack frame( Rii) , 328, 332 
stack pointer( $ sp， 栈 指针 ) ，327 
storing additional arguments on (存储 额外 人 参数) , 
332-333 
storing local variable on (存储 局 部 变量 )， 
332-333 
Stalls( 阻 塞 ) ， 另 见 Hazard, 418-421 
Standard library( 标准 程序 库 ) ，657-665 
math, 664-665 
stdio, 657-662 
file manipulation( 文件 操作 ) , 660-662 
printf, 657-659 
scanf, 660 
stdlib, 662-664 
exit, 663 
format conversion(atoi, atol, atof, 格式 
转换 ) , 663-664 
rand, srand, 662-663 
string, 665 
State encoding, FSM( FSM 状态 编码 ) 4% JL Binary 
encoding, One-cold encoding, One-hot encoding, 
129-131, 134 
State machine circuit (状态 机 电路 ) 另 见 Finite 
state machine 
State variable( 状态 变量 ) 109 
Static branch prediction( 静态 分 支 预测 ) ，446 
Static discipline( 静态 约束 )，24-26 
Static power( 静态 功 耗 ) ，34 
Static random access memory( SRAM ， 静 态 随机 存 取 
存储 器 ) ，266，267 
Status flag 状态 标志 ) ，350 
stdio. h, C library (stdin h, C RARE), 5 BR 
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Standard library, 657-662 
stdlib. h, C library ( stdlib. h, C KAX JE), 5 
Standard library, 662-664 
Stepper motor ( 步 进 电动 机 ) , 549, 554-556 
bipolar stepper motor ( 双 极 步 进 电动 机 ) 554-555 
half-step drive( 半 步 驱 动 ) 554 
two- phase-on drive( 两 相 驱 动 ) 554 
wave drive( 波 驱 动 ) 554 
Stored program( 存储 程序 ) ，309-310 
Store( 存储 ) 
store byte ( sb 或 sbu, 存储 字 节 )，302- 304， 
323-324 
store half( sh 或 shu， 存 储 半 字 )，345 
store word( sw， 存 储 字 ) ，302-304 
string. h, C library( string. h, C 函数 库 ) 665 
Strings( 字 符 串 ) 另 见 Character ( char), 324, 
650-651 
Structural modeling ( 结构 建 模 ) , 173-174, 190-193 
Structure( struct, %4), 651-653 
sub, 297 
Substrate ( 衬 底 ) , 28-29 
Subtraction ( k} ), 17, 246, 297 
signed and unsigned instructions ( 有 符号 和 无 符号 
指令 ) ，344-345 
Subtractor( 减 法 器 ) ，246-247 
subu, 345 
Sum- of- products( SOP， 与 或 式 形 式 ) form, 58-60 
Superscalar processor( 超标 量 处 理 器 ) ，447-449 
Supply voltage( 电源 电压 ) ， 另 见 VDD，22 
sw, store word ( sw， 存储 字 )， 另 I Store, 
302-304 
Swap space( 交换 空间 )，504 
Switch/case statement: Switch/case 语句 
in C( 在 C 语言 中 ) 639-640 
in HDL( 在 HDL 中 )， 另 见 Case statement 
in MIPS assembly( 在 MIPS 汇编 中 ) 317 
Symbol table( 符号 表 ) 339 
Symmetric multiprocessing( SMP, Xf#KA-AbFR), A 
见 Homogeneous multiprocessors 
Synchronizer( 同步 器 ) , 152-154, 152-153 
Synchronous circuit ( 同步 电路 ) ，122-123 
Synchronous Dynamic Random Access Memory 
(SDRAM, ， 同 步 动 态 随 机 存 取 存 储 器 ) ，267 
DDR( 双 倍数 据 速率 ) ，267 
Synchronous logic, design( 同步 还 辑 设 计 ) 119-123 
Synchronous resettable flip- flop (同步 复位 触发 


2r), 116 
Synchronous sequential circuit ( 同步 时 序 电 路 ) ， 另 
JL Finite state machine, 120-123, 122 
timing specification ( 时 序 规范 ) ， 另 见 Timing a- 
nalysis 
Synergistic Processor Element (SPE, t [Fl] 2b #248 3c 
#), 457 
Synergistic Processor Unit( SPU ) ISA ( 协同 处 理 需 单 
元 ( SPU)ISA), 458 
SystemVerilog， 另 见 Hardware description languages , 
173-225 
accessing parts of busses (访问 总 线 部 件 )， 
188, 192 
bad synchronizer with blocking assignments ( 使 用 阻 
塞 赋值 的 错误 的 同步 器 ) , 209 
bit swizzling( 位 交叉 混合 ) ，188 
blocking and nonblocking assignment( 阻 塞 和 非 阻 
塞 赋值 ) ，199-200，205-=208 
case statement( case 语句 ) ，201-202 ，205 
combinational logic using( 组 合 逻 辑 ) 177-193, 
198-208, 217-220 
comment( 注释 ) 180 
conditional assignment ( 条 件 语 句 ) 181-182 
data type( 数据 类 型 ) ，213-217 
decoder( 译 码 器 ) , 202-203, 219 
delay(in simulation)( 延 时 (在 模拟 中 ) ) 189 
divide-by-3 FSM( 除 以 3 FSM), 210-211 
finite state machines (FSM， 有 限 状 态 机 )， 
209-213 
Mealy FSM，213 
Moore FSM, 210, 212 
full adder( 全 加 器 ) , 184 
using always/ process( 使 用 always/ process) , 200 
using nonblocking assignments (使 用 非 阻 塞 赋 
值 ) ，208 
history of( 历史 ) ，175 
if statement( 放 语句)，202-205 
internal signal( 内 部 信号 ) 182-184 
inverter( 反 相 器 ) 178, 199 
latche( 锁 存 器 ) 198 
logic gate( £4) ]), 177-179 
multiplexer ( 2 Fl #), 181- 183, 190- 193, 
218-219 
multiplier( 乘法 器 ) , 217 
number( 数字 ) 185-186 
operator( 运算 符 ) , 185 
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parameterized module( 参数 化 模块 ) 217-220 
N; 2” decoder( N:2 " 译 码 器 ) 219 
N-bit multiplexer( N 位 复 用 器 ) 218-219 
N-input AND gate( N 输入 与 门 ) 220 
priority circuit( 优先 级 电路 ) ，204 
using don’ t care( 使 用 无 关 项 ) ，205 
reduction operator( 缩减 运算 符 ) ，180-181 
register( 寄存 器 ) ，193-197 
enabled( 使 能 ) ，196 
resettable( 复位 ) ，194-196 
sequential logic using( 时 序 逻 辑 ) 193-198, 209- 
213 
seven- segment display decoder (7 段 显 示 译 码 
TE 201 
simulation and synthesis( 模拟 和 综合 ) , 175-177 
structural model( 结构 模型 ) 190-193 
synchronizer( 同步 器 ) , 197 
testbench ( 测试 程序 ) 220-224, 437-438 
self- checking( 自 测试 ) 222 
simple( 简单 )，221 
with test vector fle( 带 测试 癌 量 文件 )， 
223-224 
tristate buffer( 三 态 缓冲 器 ) ，187 
truth table with undefined and floating input ( 未 和 定 
义 和 浮 空 输入 的 真 值 表 ) 187, 188 
zsandxs(z 和 x)，186-188 ，205 
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Tag( 标签 ) 483 
Taking the two’ s complement( 取 补 码 ) ，16-17 
Temporal locality (时 间 局 部 性 ) 476, 481-482, 
485, 490 
Temporal parallelism( 时 间 并 行 ) 158-159 
Temporary register( 临时 寄存 器 ) ，299 ，329-330 
Ternary operator( 三 元 运算 符 ) 181, 635 
Testbenche, HDL( 测试 程序 ，HDL) 220-224 
for MIPS processor( MIPS 处 理 器 ) ，437-438 
simple( 简单 ) , 220-221 
self-checking( 目测 试 ) , 221-222 
with testvector( 带 测试 回 量 ) ，222-224 
Text segment( 文本 段 ) 336, 340 
Thin Quad Flat Pack (TQFP， 薄 型 四 方 扁平 封 
装 ) ，$10 
Thin Small Outline Package(TSOP， 薄 型 小 尺寸 封 
ee), 599 
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Thread Level Parallelism(TLP， 线 程 级 并 行 ) 455 
Threshold voltage( WHE), 29 
Throughput ( Æ nt Æ ), 157- 160, 374-375, 409- 
411, 455 
Timer( 计时 器 ) , 527-529 
delay generation using( 延 时 生成 ) ，528-529 
Timing( 时 序 ) 
of combinational logic( 组合 逻辑 ) 88-95 
delay( 延迟 ) , 4% WL Propagation delay, Contam- 
ination delay 
glitche( 毛刺 ) , 4 XZ Glitche 
of sequential logic( 时 序 逻 辑 ) 141-157 
analysis( 分 析 ) ， 另 见 Timing analysis 
clock skew( 时 钟 偏 移 ) ， 另 见 Clock skew 
dynamic discipline( 动态 约束 ) 141-142 
metastability( 亚 稳 态 ) ， 另 见 Metastability 
resolution time (解析 时 间 )， 另 见 
Resolution time 
system timing( 系 统 时 序 ) ， 另 见 Timing analysis 
Timing analysis( 时 序 分 析 ) 141-151 
calculating cycle time( 计算 周期 时 间 ) ， 另 见 Set- 
up time constraint 
hold time constraint ( 保持 时 间 约 束 )， 另 见 Hold 
time constraint 
max-delay constraint( 最 大 延 时 约束 ) ， 另 见 Setup 
time constraint 
min- delay constraint( 最 小 延 时 约束 )， 另 见 Hold 
time constraint 
multi-cycle processor( 多 周期 处 理 器 ) ，407-408 
pipelined processor( it 7K Ae AbFEAE) ，428 
setup time constraint( 建立 时 间 约 束 ) ， 另 见 Setup 
time constraint 
single- cycle processor( 单 周期 处 理 器 ) , 388-389 
with clock skew( 时 钟 偏 移 ) ， 另 见 clock skew 
TLB( 转 换 后 备 缓冲 器 ) ， 另 见 Translation lookaside 
buffer 
Trace cache( 跟踪 缓存 ) ，463 
Transistor( 晶体 管 ) 26-34 
bipolar( 双 极 极 的 ) ，26 
CMOS, 26-33 
gate made from( 门 ) 31-34 
latch and flip-flop( 锁 存 器 和 触发 器 ) 116-117 
MOSFET, 26 
nMOS, 28-34, 29-33 
pMOS, 28-34, 29-33 
pseudo-nMOS( f4 nMOS), 33-34 


478 


ROM and PLA( ROM 和 PLA) , 279-280 
transmission gate( 传输 门 ) ，33 
Transistor- Transistor Logic( TTL, MAE- AA E 
辑 ) 25-26, 597-598 
Translating and starting a program ( 转换 和 开始 执行 
程序 ) 337-342, 338 
Translation Lookaside Buffer ( TLB ， 转 换 后 备 缓冲 
#%), 502-503 
Transmission Control Protocol and Internet Protocol 
(TCPZP ， 传 输 控 制 协议 /因特网 协议 ); 561 
Transmission gate( 传输 门 ) ，33 
Transmission line( 传输 线 ) , 602-615 
characteristic impedance( 特性 阻抗 ) ，612-613 
derivation of ( 来源) ，612-613 
matched termination( 匹配 终端 )，604-606 
mismatched termination( 不 匹配 终端 ) 607-610 
open termination( 开路 终端 ) ，606-607 
reflection coefficient ( 反射 系数 ) 613-614 
derivation of ( ÆW) 613-614 
series and parallel termination( 串联 和 并 联 终端 ) , 
610-612 
short termination( 短路 终端 ) , 607 
when to use( 何 时 使 用 ) , 610 
Transparent latch( 透明 锁 存 器 ) ， 另 见 D latch 
Traps( BiG), 343 
Tristate buffer( =h) , 74-75, 187 
HDL for( 硬件 描述 语言 ) 186-187 
multiplexer built using( 用 于 构建 多 路 选择 需 )， 
84-85, 91-93 
Truth table( 真 值 表 ) , 20 
ALU decoder( ALU 译 码 器 ) 383, 384 
multiplexer( 复 用 需 ) , 83 
seven- segment display decoder(7 Bt ft ax VF 5 
fir), 79 
SR latch( SR 锁 存 器 ) 111, 1/2 
with don’ t care( 带 无 关 项 ) , 69, 81-83, 205 
with undefined and floating inputs( 带 未 定义 和 浮 
空 输入 ) , 187-188 
TSOP (薄型 小 尺寸 封装 )， 另 见 Thin small 
outline package 
TIL( 晶体 管 - 晶体 管 逮 辑 ) ， 另 见 Transistor- Tran- 
sistor Logic 
Two-bit dynamic branch predictor ( 双 位 动态 分 支 预 
测 )，447 
Two-cycle latency of 1w( 1w 的 两 周期 延 时 ) ，418 
Two-level logic( IUE F$), 69 
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Two’ s complement numbe(2 的 补 码 数 ) 16-18 
typedef, 653-654 


U 
UART( 通用 异步 收发 器 )， 另 见 Universal Asyn- 


chronous Recelver Transmitter 
Unconditional branch( 无 条 件 分 支 ) 315-316 
Undefined instruction exception (未 定义 的 指令 异 
常 ) 343-344, 440-443 
Unicode( 统一 码 ) 322 
Unit Under Test( UUT， 被 测 单 元 ) 220 
Unity gain point( 单位 增益 点 ) ，24 
Universal Asynchronous Receiver Transmitter( UART, 
通用 异步 收发 器 ) , 521-527 
hardware handshaking( 硬件 握手 ) 523 
STA register(STA 寄存 器 ) , 524 
Universal Serial Bus( USB, i FA B47 AR), 270, 
523, 559-560 
USB 1.0, 560 
USB 2.0, 560 
USB 3.0, 560 
Unsigned multiplier( 无 符号 乘法 器 ) , 217 
Unsigned number( 无 符号 数 ) ，18 
USB( 通用 串 行 总 线 ); JJL Universal Serial Bus 
USB link( USB 链接 ) , 563-564 
FTDI, 563 
UM232H module( UM232H 模块 ) 564 
Use bit(U， 使 用 位 ) 490 


V 


Valid bit(V， 有 效 位 ) 484 
Variable in C(C 语言 中 的 变量 ) 629-633 
global and local( 全 局 和 局 部 ) ，631-632 
initializing( 初 始 化 ) ，633 
primitive data types( 基本 数据 类 型 ) ，630-631 
Variable- shift instruction( 变量 移 位 指令 ) 313 
Vec， 另 见 Supply voltage, Vpop, 23 
Von( 电 源 电 压 ) ， 另 见 Supply voltage, 22, 23 
Vector processor( 问 量 处 理 闫 ) ，447 
Verilog， 另 见 SystemVerilog 
Very High Speed Integrated Circuits ( VHSIC) 175, 
另 见 VHDL 
VGA( 视频 图 形 阵 列 ) ， 另 见 VGA monitor 
VGA( Video Graphics Array ) monitor( VGA ( 视频 图 形 
阵列 ) ERAR), 541-547 


connector pinout( 接口 引 脚 ) ，543 
driver for( 驱动 程序 )，544-547 
VHDL, # JL VHSIC Hardware Description Language 
VHSIC, 4 JIL Very High Speed Integrated Circuits 
VHSIC Hardware Description Language( VHDL, VH- 
SIC 硬件 描述 语言 ) 173-175 
accessing parts of buss( 访问 总 线 部 件 ) 188, 192 
bad synchronizer with blocking assignment( 使 用 阻 
塞 赋值 的 错误 同步 器 ) 209 
bit swizzling( 位 交叉 混合 )，188 
blocking and nonblocking assignment( 阻塞 和 非 阻 
塞 赋值 ) ，199-200，205-208 


case statement( case 1A 4J), 201-202, 205 


combinational logic using (21 A 2#), 177-193, 
198-208, 217-220 


comment( 注释 ) , 180 

conditional assignment ( 条 件 语 句 ) 181-182 

data type( 数据 类 型 )，213-217 

decoder( 译 码 器 ) ，202-203， 219 

delay ( in simulation ) (延迟 ) (在 模拟 中 ) 189 

divide- by-3 FSM( 除 以 3 FSM), 210-211 

finite state machine ( FSM, ERRA BL), 
209-213 
Mealy FSM, 213 
Moore FSM, 210, 212 

full adder( 42 JIN #8) ， 184 . 
using always/ process ( 使 用 always/process) , 200 
using nonblocking assignments ( 使 用 非 阻 塞 赋 

值 ) 208 

history of (JH +), 175 

if statement ( if 749) ) , 202-205 

internal signal( 内 部 信号 ) ， 182-184 

inverter( 反 相 器 ) ，178， 199 

latch( 锁 存 器 ) ，198 

logic gate( weet), 177-179 

multiplexer ( 复 用 器 )，181- 183, 190- 193, 

218-219 

multiplier ( 乘法 器 ) ，217 

number( 数字 ) ， 185-186 

operator ( 运算 符 ) 185 

parameterized modules( 参数 化 模块 ) ， 217-220 
N:2" decoder( N:2" 译 码 器 ) ，219 
N-bit multiplexer( N 位 复 用 器 ) 218-219 
N-input AND gate( N 输入 与 门 ) 220, 220 

priority circuit( 优先 级 电路 ) ，204 
using don’ t care( 使 用 无 关 项 ) 205 
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reduction operator( 缩减 运算 符 ) 180-181 
register( 寄存 器 ) ，193-197 

enabled( 使 能 ) ，196 

resettable( 复位 ) ，194-196 


sequential logic using( EJF Z4) , 193-198, 209- 
213 
seven- segment display decoder (7 段 显 示 译 码 
器 ) ，201 y 
simulation and synthesis ( 模拟 和 综合 ) , 175-177" 
structural model ( 结构 模型 ) 190-193 
synchronizer( 同步 器 ) , 197 
testbench (测试 程序 ) , 220-224, 437-438 
self- checking ( A Wit) , 222 


simple( fi] #2), 221 
with test vector Gile( 带 测试 向 和 量 ) , 223-224 
tristate buffer( 三 态 缓冲 人 器) 187 
truth table with undefined and floating input ( AR XE 
义 和 浮 空 输 大 的 真 值 表 ) , 187, 188 
z s and x’ s(z Mx), 186-188, 205 
Video Graphics Array( VGA, 视频 图 形 阵列 ) ， 另 见 
VGA monitor 
Virtual address( 虚拟 地 址 ) 497 
space( 空 l), 503 
Virtual memory ( 虚拟 内 存 ) 478, 496-506 
address translation ( 地 址 转换 ) , 497-500 
cache terms comparison ( 缓存 术语 比较 ) ， 497 
memory protection ( 内 存 保护 )，503 
multilevel page table( 多 级 页 表 )， 504-506 
page fault( 页 面 失效 ) ，497 
page number( 页 号 ) 498 
page offset( 页 偏 移 量 ) 498 
page table( 页 表 ) , 500-501 
page( 页 面 ) 497 
replacement policy ( 替换 策略 ) , 504 
Translation Lookaside Buffer(TLB ， 转 换 后 备 缓冲 
器 ) 502-503 
write policy( 写 策 略 ) ，494-495 
x86, x86, 567 


Virtual Page Number( VPN, 虚拟 页 号 )， 499 
Virtual page( 虚拟 页 , 497 
Va, 23 


W 


Wafer( 硅 片 ) 28 
Wait state( 等 待 状态 ) 564 
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Wall, Larry, 20 

WAR( 读 取 后 写 入 ) 4% Write after read 

WAW( 写 人 后 写 人 ) ， 另 见 Write after write 

Weak pull-up( 弱 上 拉 )，33 

Weird number( 怪异 数 ) ，18 

While loop( while 循环 ) , 318-319, 641 

White space( 空格 ) , 180 

Whitmore, Georgiana, 7 

Wi-Fi, 561 

Wire( 导线 ) 67 

Wireless communication, Bluetooth (Jc 2i8 (8, K 
F), 547-548 

Word- addressable memory ( 字 可 寻 址 存储 器 )， 
301, 302 

Wordline( 2%) , 264 

Write After Read( WAR) hazard( i PUA 5 A ( WAR) 
冲突 ) ， 另 见 Hazard, 451-453 

Write After Write ( WAW ) hazard ( 写 人 后 写 人 
(WAW) 冲 突 ) 451 

Write policy( 写 策略 ) ，494-495 
write-back( 写 回 ) , 494-495 
write-through( 直 写 ) 494-495 


X 


X, ñ J Contention, Don’ t care 
x86 
architecture ( 体系 结构 ) , 347-355 
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branch condition ( 分 支 条 件 ) ，352 
instruction encoding( 指令 编码 ) 352-354, 353 
instruction( #§4>) , 350-352, 351 
memory addressing mode( 内 存 寻 址 模式 ) ，349 
operand( 操作 数 ) ，348-350 
register( 寄存 器 ) ，348 
status flag( 状态 标志 ) ，350 
vs. MIPS( 和 MIPS 比较 ) 348 
cache system( 缓存 系统 )，564-567 
memory system, evolution of (存储 器 系统 ， 演 
化 ) 565 
microarchitecture ( 微 体 系 结构 )，458-465 
evolution of( 演化 ) ，458-459 
programmed JVO( 可 编程 YVO) , 567-568 
register( 寄存 器 ) 348 
virtual memory( 虚拟 内 存 ) , 567 
protected mode( 保护 模式 ) , 567 
real mode( 实 模式 ) 567 
Xilinx FPGA, 274-276 
XNOR gate( 同 或 门 ) 21-22 
XOR gate( 异 或 门 ) 21 
xor, 311 
xori, 311-312 


Z 


Z( 浮 空 ) , A 见 Floating 
Zero extension( H E), 250, 308, 311-312, 34 
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Digital Design and Computer Architecture Second Edition 


本 书 采 用 流行 的 教学 法 ， 从 计算 机 组 成 和 设计 向 下 至 更 精细 的 层次 ， 详 细 展 示 如 何 用 SystemVerilog 和 
VHDL MIPSA R., ABAFE eT 一 个 很 好 的 机 会 ， 使 他 们 可 以 在 现代 FPGA 上 进行 大 型 的 数 
字 设 计 ， 既 能 增长 学 生 的 专业 知识 ， 又 能 启发 学 生 运用 所 学 知识 去 解决 实际 问题 

David A. Patterson 


WN AA se oe, 计算 机 组 成 与 设计 ”的 作者 之 


本 书 采用 一 种 独特 的 现代 数字 设计 方法 ， 先 介绍 数字 逻辑 门 ， 接 着 讲述 组 合 电路 和 时 序 电 路 的 设计 ， 并 

这 些 基本 的 数字 逻辑 设计 概念 为 基础 ， te les» 另外 ， 在 全 书 的 实例 中 运用 
omen 和 WH MGS F CAGE AM GARR. 过 本 书 ， 读 者 能 够 构建 自己 的 微 处 理 器 ， 并 能 
够 自 顶 向 下 地 理解 微 处 理 器 的 工作 原理 。 

第 2 版 更 新 了 关于 微机 上 通用 处 理 器 以 及 几乎 随处 可 见 的 微 控 制 器 中 的 MO 系统 的 内 容 ， 提 供 了 多 个 实例 来 
说 明 如 何 使 用 RS232、SPI、 电 机 控制 、 中 断 、 无 线 和 模 数 转换 器 与 外 围 设备 交互 。 除 了 对 全 书 内 容 进 行 更 新 和 
扩展 外 ， 新 版 在 编程 和 代码 例题 中 采用 SystemVerilog ( 替代 Verilog ) 与 VHDL 两 种 语言 给 出 数字 系统 设计 的 实 
现 。 中 文 版 还 新 增 附录 D “MIPS 处 理 器 的 FPGA 实 现 ”， 补 充 在 实际 开发 板 和 软件 开发 环境 上 设计 和 实现 计算 
机 微 处 理 器 系统 的 相关 内 容 。 


第 2 版 特色 
e 介绍 数字 逻辑 设计 的 基础 知识 ， 并 通过 设计 实际 的 MIPS 微 处 理 器 来 加 强 逻 辑 概念 。 
e 在 例题 部 分 ， 分 别 用 两 种 最 流行 的 硬件 描述 语言 ( SystemVerilog 和 VHDL ) 给 出 相应 数字 系统 设计 的 实现 。 
@ 通过 大 量 示例 ， 加 深 读 者 对 关键 概念 和 技术 的 理解 和 记忆 。 
o 新 增 附录 DD “MIPS 处 理 器 的 FPGA 实 现 ”， 和 帮助 读 者 使 用 主流 工具 和 软件 开发 环境 进行 实际 应 用 设计 。 
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